1.安装
pip install pandas
import pandas as pd
2.数据结构
- series
一维数组,对象可以是不同类型,也可以自定义索引,类似于dict。
series.add(2): 给每一个元素加上2,与numpy.array的广播函数一致。
b = pd.Series([2,5,8])
b
0 2
1 5
2 8
dtype: int64b = b.add(8)
b
0 10
1 13
2 16
dtype: int64b = b.mod(3)
b
0 1
1 1
2 1
dtype: int64阿斯顿
- DataFrame
既有行索引又有列索引:
import numpy as np
import pandas as pd
pd.DataFrame({‘a’:[1,2],‘b’:[2,3],‘c’:[3,4],‘d’:[4,5]})
a b c d
0 1 2 3 4
1 2 3 4 5pd.DataFrame(np.array([[1,2,3,4],[3,4,5,6]]),index=[‘one’,‘two’])
0 1 2 3
one 1 2 3 4
two 3 4 5 6pd.DataFrame([pd.Series([11,12,13,14]),pd.Series([21,22,23,24])])
0 1 2 3
0 11 12 13 14
1 21 22 23 24
- Time Series
index = pd.date_range(‘1/10/2018’, periods=5)
pd.DataFrame(np.random.randn(5, 3), index=index, columns=list(‘ABC’))
A B C
2018-01-10 -1.631258 -0.568379 0.319282
2018-01-11 -0.708094 1.107151 1.364287
2018-01-12 0.649978 -0.494478 1.076287
2018-01-13 0.079650 -1.634735 0.794655
2018-01-14 0.330134 0.890559 0.735603