python代码将重复性(csv,excel)文件“拼接”在一起

废话不多说,不讲教学,只讲用法,将csv或者excel文件拼接在一起,确定一下信息:

每个表格的列数,列宽相等,

每个文件后缀相等,都为csv或者xlsx

装有glob和pandas库

文末放有24华数杯C题的附件,大家可以拿来练习下

import glob
import pandas as pd

# 1.要是合并的表格为excel 把后面的.csv后缀改成.xlsx

inputfile = r"C:/Users/10636/Desktop/附件/*.csv"#设置想要合并的数据的路径
print(inputfile)
outputfile = r"C:/Users/10636/Desktop/合并数据练习/合并后的数据.csv"#这个是你想把合并和的文件放在的位置
csv_list = glob.glob(inputfile)
filepath = csv_list[0]
# 2.在把下面带CSV的注释或者删除把下面带excel的注释去掉就欧克了
df = pd.read_csv(filepath, low_memory=False)
#low_memory=False 参数则告诉函数不要对数据进行预处理,这可以避免在处理大数据文件时出现性能问题
# df = pd.read_excel(filepath, encoding="gbk", low_memory=False)

#df = df.to_csv(outputfile, encoding="gbk", index=False)
# df = df.to_excel(outputfile, encoding="gbk", index=False)

for i in range(1, len(csv_list)):
    filepath = csv_list[i]
    df = pd.read_csv(filepath, low_memory=False)
    # df = pd.read_excel(filepath, encoding="gbk", low_memory=False)

    # 这行是设置合并后数据的表头,
    df[1] = df[1].rename(columns={'名字','链接','地址','介绍','开放时间','图片链接','评分','建议游玩时间','建议季节','门票','小贴士','Page'})
    #名字	链接	地址	介绍	开放时间	图片链接	评分	建议游玩时间	建议季节	门票	小贴士	Page



    #合并的是csv文件用这个
    df = df.to_csv(outputfile, index=False, header=False, mode='a+')

    #合并的是excel文件用这个,使用时把 # 删了,把上面的csv的开头加上 #
    # df = df.to_excel(outputfile, encoding="gbk", index=False, header=False, mode='a+')


print("合并成功!!!")

链接: https://pan.baidu.com/s/1Lb1SPO4RDVBdWsoHgUuIlw?pwd=keke 提取码: keke

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值