引入约定
import pandas as pd
数据结构
Pandas数据结构分为:
- Series
- DataFrame
Series
数组型的数据结构,由一组一维数据和相应的index构成:
属性
- index
- values
构造
创建默认index的Series(自动创建0到N-1(N为数据的长度)的整数型索引):
#pd.Series(一维数组)
pd.Series([1, 2, 3, 4])
创建自定义index的Series:
#pd.Series(一维数组, index=索引数组)
pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
通过字典创建Series :
#pd.Series(字典)
pd.Series({'a' :1,'b':2})
访问
可以通过索引的方式选取Series中的单个或一组值:
#Serires对象[索引]
s['a']
s['a','b']
DataFrame
表格型的数据结构:
属性
index
columns
values
axes
构造
创建默认index的DataFrame
#pd.DataFrame(二维数组)
pd.DataFrame([[1,2,3],[0,0,0]])
创建自定义index和columns的DataFrame
#pd.DataFrame(二维数组,index=索引名称数组,columns=列名称数组)
pd.DataFrame([[1,2,3],[0,0,0]],index=['a','b'],columns=['x','y','z'])
通过字典创建DataFrame
#pd.DataFrame(字典,index=索引数组)
pd.DataFrame({'x':[1,0],'y':[2,0],'z':[3,0]},index=['a','b','c'])