Python Pandas for Beginners: Pandas Specialization for Data Scientists
作者: AI Publishing
语言: 英文
出版年份: 2021
其他分类: 人工智能
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

《Python Pandas for Beginners Pandas Specialization for Data Scientists》是一本专为初学者编写的 Pandas 库入门书籍,由 AI Publishing 公司出版。该书详细介绍了 Pandas 库的基础知识、数据处理方法以及在数据科学中的应用,旨在帮助读者快速掌握 Pandas 的核心功能,并能够将其应用于实际的数据分析项目中。

书籍内容概述

第一章:入门与环境搭建

  • Pandas 简介:介绍了 Pandas 库的定义、优势以及在数据科学中的重要性。
  • 环境搭建:详细说明了在 Windows、Mac 和 Linux 系统上安装 Python 和 Pandas 的步骤,以及如何使用 Google Colab 云环境。
  • Python 基础:为初学者提供了 Python 编程的快速入门,包括语法、变量、数据类型、运算符、条件语句、循环和函数等内容。

第二章:Pandas 基础

  • Pandas Series:讲解了 Pandas Series 的创建方法及其基本操作,如索引、切片、统计计算等。
  • Pandas DataFrame:介绍了 DataFrame 的创建、基本操作以及如何从 CSV、TSV 文件和数据库中导入数据。
  • 处理缺失值:探讨了处理数值型和分类型缺失值的常用方法,如均值、中位数填充和众数填充。

第三章:Pandas 数据操作

  • 数据选择与索引:通过示例详细说明了如何使用 loc 和 iloc 方法进行数据的索引和切片。
  • 删除行和列:介绍了 drop() 方法的使用,以及如何过滤和排序数据。
  • 数据筛选与排序:讲解了如何根据条件筛选数据,并对数据进行排序。

第四章:数据分组、聚合与合并

  • 分组与聚合:通过 GroupBy 方法对数据进行分组,并计算每个组的统计值。
  • 数据合并:介绍了如何使用 concat() 和 merge() 方法对多个数据集进行合并。
  • 去重与数据重塑:讲解了如何去除重复数据,并使用 pivot 和 crosstab 方法进行数据重塑。

第五章:Pandas 数据可视化

  • 绘图基础:介绍了如何使用 Pandas 绘制直方图、折线图、散点图、柱状图、箱线图等常见图表。
  • 图表自定义:展示了如何通过参数调整图表的颜色、大小和其他属性。

第六章:时间序列数据处理

  • 时间序列基础:介绍了 Pandas 中的时间戳类型和日期范围的创建。
  • 时间重采样与平移:讲解了如何对时间序列数据进行重采样和时间平移。
  • 滚动窗口函数:介绍了如何使用滚动窗口函数计算移动平均、移动最大值等。

适用人群

本书适合 Python 编程初学者、数据科学新手以及希望在数据分析中使用 Pandas 的专业人士。书中提供了大量的示例代码和练习,帮助读者巩固所学知识。

通过阅读本书,读者将能够掌握 Pandas 的核心功能,并在数据科学项目中高效地处理和分析数据。

期待您的支持
捐助本站