【Python之Pandas】批量读取某一文件夹下的Excel表格数据

编程隐士

于 2024-04-29 18:08:20 发布

阅读量681

点赞数 9

文章标签： python pandas excel

本文链接：https://blog.csdn.net/qq_31180631/article/details/138306137

版权

博客介绍了使用Python处理Excel文件的方法。包括用os.walk()函数遍历文件夹，endswith()函数判断Excel后缀，tkinter.filedialog选择路径，还给出了整体代码。此外，提到使用df.drop_duplicates()对行去重，可指定列名、保留规则及是否在原数据操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、使用os.walk()函数遍历文件夹

os.walk(top, topdown=True, οnerrοr=None, followlinks=False)函数可根据给定的路径，遍历该路径下的文件夹及文件，返回三个值：1.根目录root；2.文件夹dirs；3.文件files

代码示例

main_folder = 'D:/SDHSPRO/Green'
for root, dirs, files in os.walk(main_folder):
	print(root, dirs, files)

二、使用endswith()函数判断excel后缀

str.endswith(‘.xlsx’, start, end) 判断字符串是否以指定字符或子字符串结尾

代码示例

file.endswitch('.xls')
file.endswitch('.xlsx')

三、使用文件对话框tkinter.filedialog选择路径

tk.filedialog.askdirectory(title=‘路径’)

四、整体代码

import os
from tkinter import filedialog
def select_main():
    main_folder = tkinter.filedialog.askdirectory(title='路径')
    all_data = []
    for root, dirs, files in os.walk(main_folder):
        for file in files:
            if file.endswith(".xlsx"):  # 只处理Excel文件，可以根据需要修改扩展名
                file_path = os.path.join(root, file)  # 包含文件名的路径
                df = pd.read_excel(file_path, skiprows=1)  # 跳过前一行无用数据
                all_data.append(df)
            elif file.endswith(".xls"):
            	file_path = os.path.join(root, file)  # 包含文件名的路径
                df = pd.read_excel(file_path, skiprows=1, engine='xlrd')  # 跳过前一行无用数据
                all_data.append(df)
 	print(all_data)