目录
概述
Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。
Pandas 适用于处理以下类型的数据:
- 与 SQL 或 Excel 表类似的,含异构列的表格数据;
- 有序和无序(非固定频率)的时间序列数据;
- 带行列标签的矩阵数据,包括同构或异构型数据;
- 任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记。
一、创建Pandas对象
- 通过传一些值的列表来创建一个Series,Pandas会自动创建一个默认的整数索引
- 通过传递带有日期时间索引和带标签列的NumPy数组来创建DataFrame
- 通过传递可以转化为类似Series的dict对象来创建DataFrame
二、查看数据
(一)head()和tail()方法
查看DataFrame的顶部和头部
(二)显示索引、列和底层NumPy数据
(三)to_numpy()方法
对于df这种所有值为单一类型的DataFrame,to_numpy()操作是高效的,并且不会复制数据
4. 然而对于df2这种DataFrame对象有多种类型的,to_numpy操作是比较费事的
(四)describe()方法
显示数据的快速统计概要
(五)转置数据
(六)按轴排序
(七)按值排序
三、选择
(一)获取
选择一个列,产生一个“Serise”,相当于“df.A”,这里也可以通过[]选择,对行进行切片
(二)按标签选择
通过标签获取一行数据
通过标签在多个轴上选择数据
通过标签同时在两个轴上切片