目录
- 学习目标
- 了解
Numpy
与Pandas
的不同 - 了解Pandas的
MultiIndex
结构 - 说明Pandas的
Series
与Dataframe
两种结构的区别
- 了解
1. Pandas介绍
- 专门用于数据挖掘的开源python库
- 便捷的数据处理能力
- 读取文件方便
- 封装了
Matplotlib
、Numpy
的画图和计算
1.1 Pandas处理案例
import pandas as pd # 导入pandas
import numpy as np # 导入numpy
在numpy中创建的股票涨跌幅数据:
# 创建一个符合正太分布的10个股票5天的涨跌幅数据
stock_change = np.random.normal(0, 1, (10, 5))
stock_change
# 结果如下:
array([[-0.91867277, -0.01173701, 0.68127664, 0.03944509, 0.07340053],
[ 1.64615704, 1.722447 , 1.4732438 , -0.55938377, 0.79465845],
[ 0.30489358, 1.63522154, -0.82240368, 0.18247757, -1.6392917 ],
[ 0.64931556, -2.17863281, 0.22932751, -0.20422198, 0.81853962],
[-0.45311795, 1.27772326, -0.8559847 , 1.0495697 , -0.61348213],
[ 1.43013223, 1.28310324, -0.72455083, -0.45605234, 0.7651909 ],
[ 0.58600984, 0.08170102, -0.00801772, -0.87923389, -1.89341008],
[-0.16982775,