1.数据获取
一切工作的开始。
1.1数据初始化
pandas 有两种数据结构,DataFrame和Numpy。为什么要单独创造新的数据结构呢?python自身的数据结构不好用吗?新数据结构有什么优势呢?答案是:新的数据结构好用得飞起,
这两种结构可以进行矩阵运算,这就意味着一些数学矩阵的处理可以被快速地完成,以及快速地进行查询并赋值。
DataFrame:
一种基于numpy的数据格式,可以同时存储和展示多个维度的数据,具体张下面这样。
import pandas as pd
import numpy as np
date_range('20130101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(df)
A | B | C | D | |
---|---|---|---|---|
2013-01-01 | 0.703378 | -0.959575 | -1.613057 | -0.114338 |
2013-01-02 | -0.343408 | -0.379881 | -0.735925 | 2.524115 |
2013-01-03 | 2.536322 | -0.441642 | -0.514564 | -1.198413 |
2013-01-04 | -1.072813 | 0.571710 | -1.226546 | -1.505016 |
2013-01-05 | -0.389734 | 1.211053 | -1.325043 | -0.724410 |
2013-01-06 | -0.326073 | -0.152085 | 0.129887 | -0.766101 |
Numpy: