文件的导入与导出
CSV文件
df = pd.read_csv(r"文件路径", sep=',', header=None, encoding='utf-8')
df.head(10)
# sep分隔符。 csv文件的分隔符就是,可以默认。
# header='infer'默认以第一行作为标题, header=None不要以第一行作为标题
# encoding默认是utf-8
导入Excel文件
df = pd.read_excel(r"文件路径.xlsx",sheet_name=0, header=None)
df
# sheet_name要读取的表的表名,0表示读取第一张表, 1第二张
# header=None 不要以第一行作为标题
导入TXT文件
df = pd.read_csv(r"C:\Users\EDZ\Desktop\数据清洗\第三天\data\bill_txt.txt", sep='\t', header=None, encoding='utf-8')
df
# txt文件依旧使用pd.read_cvs
# sep改成'\t'
# header='infer'默认以第一行作为标题, header=None不要以第一行作为标题
导入其他文件
df = pd.read_csv(r"C:\Users\EDZ\Desktop\数据清洗\第三天\data\bill_txt_ansi.txt",
sep='\t',
header=None,
encoding='ansi')
df
数据的导出
df.to_csv('test1.csv')
df.to_excel('test4.xlsx', index=False)
# 不要行索引
# 文件的导出要注意,导出的文件在打开jupyter notebook的相同路径里