需求:
多个excel表格,表头相同,表格内容不同。将多个合并成一个表格。
系统:
macOS 11
版本:
python3.9
代码:
import pandas as pd
import os
#文件路径
file_dir = r'/Users/xxx/Desktop/合并excel代码'
#构建新的表格名称
new_filename = file_dir + '/new_file.xlsx'
#找到文件路径下的所有表格名称,返回列表
file_list = os.listdir(file_dir)
new_list = []
for file in file_list:
#重构文件路径
file_path = os.path.join(file_dir,file)
#将excel转换成DataFrame
dataframe = pd.read_excel(file_path)
#保存到新列表中
new_list.append(dataframe)
#多个DataFrame合并为一个
df = pd.concat(new_list)
#写入到一个新excel表中
df.to_excel(new_filename,index=False)
遇到的坑:
1.纯新手,完全不会python,pandas需要安装。安装命令:pip3 install pandas。
2.安装之后运行,提示:ImportError: Missing optional dependency ‘xlrd’. Install xlrd >= 1.0.0 for Excel support Use pip or conda to install xlrd.
3.接着安装xlrd,pip3 install xlrd。发现还是不行:ValueError: Your version of xlrd is 2.0.1. In xlrd >= 2.0, only the xls format is supported. Install openpyxl instead.
4.接着安装openpyxl。pip3 install openpyxl。再运行
5.最坑的来了,提示:ValueError: File is not a recognized excel file。明明文件夹中文件都是.xlsx,然后百度查了一堆,比如不能用wps要用word,比如xlrd不能和openpyxl混用等等等。试了一大圈之后发现,macOS系统中文件夹里有一个隐藏的.DS_Store,(一万匹草泥马!!!)删掉这个文件,再运行代码。
6.成功解决