1.打开csv文件使用data= pandas.csv_file(filename)
如果打开的数据是乱码则,在参数里面设置下encoding
2.读取前m行 、后m行分别使用data.head(m)和data.tail(m)
3.使用groupby().sum后索引变为了Multiindex不能在对其使用dataframe的相关操作,此时调用reset_index()就可以了。
如果采用groupby后保持原来的索引则设置参数as_index=False
TMP.groupby(['key1','key2'], as_index=False).sum()
4.读写csv文件
读取 pd.read_csv('foo.csv')
写入 df.to_csv('foo.csv')
5.更改dataframe列的顺序两种方法
例子:
方法一:
cols = list(df)
cols.insert(2, cols.pop(cols.index('B')))
df = df.ix[:, cols]
方法二:Bcol = df['B'] df.drop(labels=['B'], axis=1,inplace = True) df.insert(2, 'B', Bcol)