python_合并多个表格为一个

本文介绍了如何使用Python pandas库读取并合并多个Excel文件,包括处理不同结构的表格,通过os.walk遍历文件目录,最终将所有数据整合到一个DataFrame中,适合数据预处理和整理工作。
摘要由CSDN通过智能技术生成

python_合并多个表格为一个,注意这里说的表格是正常的表格,有些xls结尾的表格实际上是html格式
看这:https://blog.csdn.net/kisswife/article/details/76595876

import os
import pandas as pd


# 将文件读取出来放一个列表里面
#file_dir = r'C:\Users\carry\Desktop\123' # 存放PDF的原文件夹
pwd = r'C:\Users\carry\Desktop\123' # 获取文件目录

# 新建列表,存放文件名
file_list = []

# 新建列表存放每个文件数据(依次读取多个相同结构的Excel文件并创建DataFrame)
dfs = []

# for root,dirs,files in os.walk(pwd): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
#   for file in files:
#     file_path = os.path.join(root, file)
#     print(file_path)
#     file_list.append(file_path) # 使用os.path.join(dirpath, name)得到全路径
#     df = pd.read_excel(file_path) # 将excel转换成DataFrame
#     dfs.append(df)

for root,dirs,files in os.walk(pwd): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
  for file in files:
    file_path = os.path.join(root, file)
    print(file_path)
    file_list.append(file_path) # 使用os.path.join(dirpath, name)得到全路径
    df = pd.read_excel(file_path) # 将excel转换成DataFrame
    dfs.append(df)

# 将多个DataFrame合并为一个
df = pd.concat(dfs)
df.head()

# 写入excel文件,不包含索引数据
# df.to_excel('test\\result.xls', index=False)
df.to_excel(r'C:\Users\carry\Desktop\123\result.xls', index=False)
# C:\Users\carry\Desktop\123

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值