废话不多说,不讲教学,只讲用法,将csv或者excel文件拼接在一起,确定一下信息:
每个表格的列数,列宽相等,
每个文件后缀相等,都为csv或者xlsx
装有glob和pandas库
文末放有24华数杯C题的附件,大家可以拿来练习下
import glob
import pandas as pd
# 1.要是合并的表格为excel 把后面的.csv后缀改成.xlsx
inputfile = r"C:/Users/10636/Desktop/附件/*.csv"#设置想要合并的数据的路径
print(inputfile)
outputfile = r"C:/Users/10636/Desktop/合并数据练习/合并后的数据.csv"#这个是你想把合并和的文件放在的位置
csv_list = glob.glob(inputfile)
filepath = csv_list[0]
# 2.在把下面带CSV的注释或者删除把下面带excel的注释去掉就欧克了
df = pd.read_csv(filepath, low_memory=False)
#low_memory=False 参数则告诉函数不要对数据进行预处理,这可以避免在处理大数据文件时出现性能问题
# df = pd.read_excel(filepath, encoding="gbk", low_memory=False)
#df = df.to_csv(outputfile, encoding="gbk", index=False)
# df = df.to_excel(outputfile, encoding="gbk", index=False)
for i in range(1, len(csv_list)):
filepath = csv_list[i]
df = pd.read_csv(filepath, low_memory=False)
# df = pd.read_excel(filepath, encoding="gbk", low_memory=False)
# 这行是设置合并后数据的表头,
df[1] = df[1].rename(columns={'名字','链接','地址','介绍','开放时间','图片链接','评分','建议游玩时间','建议季节','门票','小贴士','Page'})
#名字 链接 地址 介绍 开放时间 图片链接 评分 建议游玩时间 建议季节 门票 小贴士 Page
#合并的是csv文件用这个
df = df.to_csv(outputfile, index=False, header=False, mode='a+')
#合并的是excel文件用这个,使用时把 # 删了,把上面的csv的开头加上 #
# df = df.to_excel(outputfile, encoding="gbk", index=False, header=False, mode='a+')
print("合并成功!!!")
链接: https://pan.baidu.com/s/1Lb1SPO4RDVBdWsoHgUuIlw?pwd=keke 提取码: keke