Pandas
1 Pandas概述
Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。
Pandas 适用于处理以下类型的数据:
- 与 SQL 或 Excel 表类似的,含异构列的表格数据;
- 有序和无序(非固定频率)的时间序列数据;
- 带行列标签的矩阵数据,包括同构或异构型数据;
- 任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记。
2 Pandas基本数据结构
数据类型 | 区别 | 联系 |
---|---|---|
Series | 一维数据结构,由index和Value组成 | DataFrame由多个Series组成,无论是行还是列,单独拆分出来都是一个Series |
DataFrame | 二维数据结构,除了有index(行)、value还有column(列) |
3 Pandas文件操作
3.1 读取文件
文件类型 | 方法 | 注释 |
---|---|---|
csv | df = pd.read_csv(’./data./table.csv’,dtype={ },encoding='utf-8 ',nrows&# |