-- coding:utf-8 –-
"""
利用 pandas 将多张 excel 表中的指定列数据合并成一张;因为原始的多张数据存在同样列名的数据,
因为原始多张 excel 是从 csv 文件转换股
并且我们只需要其中的部分列数据,所以进行指定列提取并汇总至 res 文件中
"""
import os
import pandas as pd
输入参数为 excel 表格所在目录
def to_one_excel(dir):
dfs = []
# 遍历文件目录,将所有表格表示为 pandas 中的 DataFrame 对象
# for root_dir, sub_dir, files in os.walk(r'' + dir): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
for root_dir, sub_dir, files in os.walk(dir): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
for file in files:
if file.endswith(‘xlsx’):
# 构造绝对路径
file_name = os.path.join(root_dir, file)