pandas处理数据
1、创建数据
创建Series,让pandas创建一个索引
2查看数据
查看框架的顶行和底行
head()
tail()
显示索引、列、基础numpy数据
index
columns
values
describe()
显示快速统计摘要
3、缺少数据
删除缺少数据的行
line.dropna(how=’any’)
填写缺少的数据
line.fillna(value=5)
4、将函数应用于数据
df.apply(lambda x:x.max() -x.min())
5、读写数据
写df.to_csv(‘foo.csv’)
读pd.read_csv(‘foo.csv’)
写df.to_hdf(‘foo.h5’,’df’)
读pd.read_hdf(‘foo.h5’,’df’)
写df.to_excel(‘foo.xlsx’,sheet_name=’Sheet1’)
读pd.read_excel(‘foo.xlsx’,’Sheet1’,index_col=None,na_values=[’NA’])