基本类型
pandas
具有如下两种数据结构:
Series
DataFrame
创建
创建以上两种数据类型的来源主要有:
- python自带的
列表
和字典
- numpy中的数据类型
- pandas自带的数据类型
s = pd.Series(data, index)
df = pd.DataFrame(data, index, columns)
访问数据
- 通过整数下标
iloc
- 通过字符下标
loc
- 布尔值
- 切片
- idxmax/idxmin
合并
- concat
- merge
- append
reshape
- stack && unstack
数值统计
- mean()
- value_counts()
- sub
- apply
IO操作
- csv
df.to_csv('foo.csv')
dk = pd.read_csv('foo.csv')
- HDF5
df.to_hdf('foo.h5', 'df')
dk = pd.read_hdf('foo.h5', 'df')
- Excel
df.to_excel('foo.xlsx', sheet_name='Sheet1')
dk = pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA'])
Reference: