再也不用担心自己处理Excel表格的效率了

最新推荐文章于 2024-10-03 09:02:12 发布

一城山水

最新推荐文章于 2024-10-03 09:02:12 发布

阅读量127

点赞数 1

分类专栏：数据分析必备文章标签： python

本文链接：https://blog.csdn.net/weixin_45215649/article/details/116897131

版权

数据分析必备专栏收录该内容

5 篇文章 1 订阅

订阅专栏

这篇博客分享了如何在Python3中批量合并Excel文件的方法。提供了两种查找文件的途径，适用于Windows和非Windows用户。使用pandas库读取并合并Excel文件，并提供了处理敏感信息的示例。最后给出了完整代码示例，适用于需要合并多个Excel文件的场景。

摘要由CSDN通过智能技术生成

Python3 批量合并Excel

以下为实战经验分享：
如果是需要先处理在合并的话，只需在merge_file()方法下进行调整。
Windows 下这里推荐使用search() 方法查找文件，非 Windows 可以使用下面的get_file()方法，具体原因可以查阅关于pathlib 包。

Windows 下查找路径下某类型的文件

import os 

def search(dirname, filename):
    """
    :param dirname: 需要查找的目录
    :param filename: 文件类型
    :return:
    """
    result =[]
    for item in os.listdir(dirname):
        item_path = os.path.join(dirname, item)
        if os.path.isdir(item_path):
            search(item_path, filename)
        elif os.path.isfile(item_path):
            if filename in item:
                result.append(item_path)
    return result

非Windows用户下面方法请参考，(mac 用户亲测有效)

import pandas as pd 
from pathlib import Path

def get_file(patterns, path):
    """
    :param patterns: 所要查找的文件类型
    :param path: 路径
    :return:
    """
    all_files = []
    p = Path(path)
    for item in patterns:
    	# 关于glob查找文件，可以去查阅相关资料，与正则类似
        file_name = p.rglob(f'**/*.{item}')
        all_files.extend(file_name)
    return all_files

def merge_file(file):
	"""
	:param file: 文件名
	"""
    merge_file_name = pd.DataFrame()
    for i in file:
        print(i)
        """
        对于 含有身份证，手机号码，日期 等格式，这里希望你指定格式读取
        如下方，coverters = {'身份证号码': str}} 防止合并出错
        """
        df = pd.read_excel(str(i), converters={'身份证号码': str}) 
		# 如果需要先处理每一个文件，可以在此编写相关代码
        merge_file_name = merge_file_name.append(df, ignore_index=False)
    merge_file_name = merge_file_name.drop_duplicates()
    merge_file_name.to_excel(goal_file, index=None)

if __name__ == '__main__':
	# 目标文件名及路径
	goal_file = ''
	# 需要查找文件的路径
	path = ''
	# 查找多个表达式为['xls','xlsx',]
	# 如下查找所有'xls' 文件
	merge_file(get_file(['xls',], path)