文章目录
pandas 使用
1. 前言
-
pandas
源于面板数据(Panel Data)、数据分析(Data analysis)。目标是成为强大的、灵活的、可以支持任何编程语言的数据分析工具。 -
数据分析重要环节:
- 加载数据
- 整理数据
- 操作数据
- 构建数据模型
- 分析数据
-
pandas
特点:- 提供一个简单、高效、有默认标签(可以自定义标签)的
DataFrame
对象; - 可以快速从文件中加载数据(csv/excel/sql);
- 可以按数据行、列进行数据分组,并对分组后数据进行处理(数据聚合、转换);
- 可以对
DataFrame
的数据进行操作(增加、修改、删除); - 可以实现数据归一化和缺失值、异常值处理;
- 可以处理不同格式的数据集(矩阵数据、异构数据表、时间序列)。
- 提供一个简单、高效、有默认标签(可以自定义标签)的
-
pandas<