今天工作遇到个问题。。
我们家的官网下载埋点数据,导出Excel时,一次就只能导出10000行,我了个乖乖,这工程师是怕我玩瘫官网吗~~~
没得办法,我只好导出了多个excel文件。
但我要一起分析啊,做做透视图什么的,所以我的需求来了:
【将多个同样格式的Excel文件进行合并】,听着是不是挺简单,ctrl+c 再ctrl+V,一个一个复制粘贴就能完成,但我觉得不如做个自动化的脚本,也方案未来使用,下面就是这个脚本啦,各位需要就可以拿去用。
【有的朋友没有开发环境,也没有开发基础,为了让这类朋友也能用上方便的工作,我特别把这些源码打包成windows可以使用的.exe文件,供各位下载直接使用,并且已经封装上了交互界面,用起来更方面】,界面如下——
下载地址:Excel合并工具,将指定目录下的所有Excel文件合并成一个文件,并保存到您指定的目录*注意被合并的Excel必须是同一格式资源-CSDN文库
首先,是要操作excel,用到了两个库,你只要简单安装一下就好。
pip install pandas
pip install openpyxl
然后,打开我们的pythonIDE,粘贴下面的代码。
import pandas as pd
import os
# 设置包含Excel文件的目录
directory = '/path/to/excel/files'
# 初始化一个空的列表,用于存储每个Excel文件的数据
all_data = []
# 遍历目录中的所有Excel文件
for filename in os.listdir(directory):
if filename.endswith('.xlsx') or filename.endswith('.xls'):
# 构造每个Excel文件的完整路径
file_path = os.path.join(directory, filename)
# 读取Excel文件并添加到列表中
df = pd.read_excel(file_path)
all_data.append(df)
# 将所有的DataFrame合并成一个
merged_data = pd.concat(all_data, ignore_index=True)
# 保存合并后的数据到新的Excel文件
merged_data.to_excel('/path/to/save/merged_file.xlsx', index=False)
print("所有Excel文件已成功合并并保存为merged_file.xlsx")
有几处需要修改
1、directory
*****特别说明,这个路径,如果你使用的是windows环境,这个地址有两种写法。
方法1:使用双反斜杠 \
path = "C:\\Users\\Danmo\\Desktop\\orc"
方法2:使用前缀 r
在字符串前添加一个 r,表示这是一个“原始字符串”,内部的反斜杠不再作为转义字符处理。
path = r"C:\Users\Danmo\Desktop\orc"
2、merged_data.to_excel('/path/to/save/merged_file.xlsx', index=False)
标红的径路和文件名也要改一下,具体改的方法可以参见第1点提供的两个方法
说明:
- directory:设置为包含所有Excel文件的目录路径。
- os.listdir(directory):获取目录中的所有文件。
- pd.read_excel(file_path):读取每个Excel文件,并将其转换为DataFrame。
- pd.concat(all_data, ignore_index=True):将所有的DataFrame合并成一个DataFrame,
ignore_index=True
表示重新索引。 - merged_data.to_excel('/path/to/save/merged_file.xlsx', index=False):将合并后的DataFrame保存为新的Excel文件。
通过这种方式,你可以快速将多个格式相同的Excel表格合并成一个新的表格。确保所有Excel文件的格式一致,以保证合并的正确性。
好啦~~ 各位是不是成功啦,祝各位好运~