目录
三、DataFrame & Python Type 的相互转换
3-1 DF.T.to_dict() 获取python dict
零、Pandas 基本介绍
pandas 适合的数据类型
- 具有异构类型列的表格数据,如SQL表或Excel电子表
- 有序和无序(不一定是固定频率)时间序列数据。
- 具有行和列标签的任意矩阵数据(均匀类型或异构)
- 任何其他形式的观察/统计数据集。实际上不需要将数据标记为放置在pandas数据结构中
pandas 应用
- 轻松处理浮点中的缺失数据(表示为NaN)以及非浮点数据
- 大小可变性:可以从DataFrame和更高维对象插入和删除列
- 自动和显式数据对齐:对象可以显式对齐到一组标签,或者用户可以简单地忽略标签,让Series,DataFrame等在计算中自动对齐数据
- 功能强大,灵活的分组功能,可对数据集执行拆分应用组合操作,以便聚合和转换数据
- 可以轻松地将其他Python和NumPy数据结构中的不规则索引数据转换为DataFrame对象
- 基于智能标签的切片,花式索引和 大数据集的子集化
- 直观的合并和连接数据集
- 灵活的数据集整形和旋转
- 轴的分层标记(每个刻度可能有多个标签)
- 强大的IO工具,用于从平面文件(CSV和分隔的),Excel文件,数据库加载数据,以及从超快HDF5格式保存/加载数据
- 时间序列 - 特定功能:日期范围生成和频率转换,移动窗口统计,移动窗口线性回归,日期转换和滞后等
pandas 数据结构
- Series - 1D labeled homogeneously-typed array (一维标记的均匀型阵列)
- DataFrame - General 2D labeled, size-mutable tabular structure with potentially heterogeneously-typed column(二维 标记,尺寸可变的表格结构,具有潜在的异质型柱)
一、Series - 一维数据结构
二、DataFrame - 二维数据结构
2-1 二维数据构造方式
2-1-2 从dict 构造
默认情况