1. pd.read_csv()
df = pd.read_csv(data_file, header=0, names=['year','population']
df= pd.read_csv(file_messy, delimiter=' ', header=3, comment='#')
1)header: header=None, 那么表示原始文件数据没有列索引,除非你给出names值,read_csv将自动加上列索引值;header=0,表示文件第0行(即第1行)为列索引,此时names如果被赋值就会替换这个列索引。
2)delimiter:delimiter另一种叫法是sep(separator)
3)names:列名
df=pd.read_csv('1.csv',index_col='date',parse_date=True)
2. to_csv()/ to_excel()
df2.to_excel('file_clean.xlsx', index=False)
df2.to_csv(file_clean, index=False)
to_csv可以将数据save成一个variable