一键合并excel表格
这篇文章是干啥的?
用python合并大量的excel表格,节省你的时间
方法:网上也有很多方法,个人觉得大家会经常把各个excel拖拽到一个文件夹里,所以本文的方法是合并一个文件夹里所有的表格
工具:建议下载一个anaconda(节省了给python配置环境的时间),当然python也可以,然后用jupyter编辑运行文中代码
我是正文分割线
进入正题:
1.第一步:把要合并的excel文件都放到一个文件里(因为大家日常工作,很习惯把邮件的excel拉到一个文件夹里,所以就选了这个方法)
2.打开jupyter编辑器,运行如下代码:
我是代码
import pandas as pd
#下面这句是包含excel文件的位置
dir = r'C:\Users\kefu\Desktop\新建文件夹1'
filenames = os.listdir(dir)
index = 0
dfs = []
for name in filenames:
print(index)
#sheet_name=3指的是excel中第4个sheet页,如果只有一个sheet,改成0即可,也可改成sheet页的名字
dfs.append(pd.read_excel(os.path.join(dir,name),sheet_name=3))
index += 1 #为了查看合并到第几个表格了
df = pd.concat(dfs)
#列1,列2,列3是你要查找的列名,如果要合并全表就省略这步
df=df[['列1','列2','列3']]
df=df.dropna(axis=0, how='all')
df=pd.DataFrame(df)
#保存到桌面的文件名
df.to_excel(r'C:\Users\kefu\Desktop\我是文件名.xlsx')
df
补充说明
sheet_name后面的位置可以选择excelsheet页的名字,如果输入数字就是位置,比如0就对应第一个sheet页,1对应第二个,因此类推
结语
用轻松的方式代替乏味重复的工作也是种令人开心的事情,欢迎大家讨论