一,Pandas库的介绍
1,参考可见:http://pandas.pydata.org
2, Pandas库是Python第三方库,提供高性能易用数据类型和分析工具。
3,Pandas库的理解
二,Pandas库的Series数据类型(一维)
1,Series类型由一组数据及与之相关的数据索引组成。
自动索引 自定义索引
2,创建
(1)从标量值创建
(2)从字典类型创建 (不同形状的):
(3)从ndarray类型创建
3,操作
对齐操作
name属性
三,Pandas库的DataFrame数据类型(二维或多维)
1,DataFrame类型由共用相同索引的一组列组成。
2,创建
(1)从二维ndarray对象创建
(2)从一维ndarray对象字典创建
(3) 从列表类型的字典创建
例子:
四,Pandas库的数据类型操作与运算
1,操作
(1)重新索引
参数
(2)索引类型
常用方法
2,运算
(1)算术运算法则
(2) 比较运算法则
五,数据
1,排序
2,基本统计分析
实例
3,累计统计分析
4,相关分析
(1)协方差:
(2)Pearson相关系数
(3)相关分析函数
实例:房价增幅和M2增幅的相关性