python批量提取汇总excel指定列数据(一列)

最新推荐文章于 2024-08-07 09:00:00 发布

若竹之心

最新推荐文章于 2024-08-07 09:00:00 发布

阅读量1.1w

点赞数 8

分类专栏： Python EXCEL 批量数据汇总文章标签： Python Excel处理数据提取文件操作数据整合

本文链接：https://blog.csdn.net/qq_45365214/article/details/123551750

版权

Python 同时被 3 个专栏收录

106 篇文章 29 订阅

订阅专栏

EXCEL

33 篇文章 5 订阅

订阅专栏

批量数据汇总

9 篇文章 2 订阅

订阅专栏

系列文章目录

前言

一、问题描述

有多个excel数据，其中每个文件内容格式相同！！
我们需要提取每个文件里面指定的一列（黄色列）数据，并保存到新工作表！！！
在这里插入图片描述
提取前：

提取后：

二、提取方法

代码如下（示例）：

import xlrd
import xlwt
from xlutils.copy import copy
import os
import  pandas  as pd


def create_excel(path, sheet_name):
    workbook = xlwt.Workbook()  # 新建一个工作簿
    workbook.add_sheet(sheet_name)  # 在工作簿中新建一个表格
    workbook.save(path)  # 保存工作簿

def read_data(FileName):
    # 1.打开文件
    open_file = xlrd.open_workbook(FileName)

    # 2.读取第二列的内容（表中第一列索引值为0）
    st = open_file.sheet_by_index(0)  #选取第一个工作表
    data = [st.cell_value(i,7) for i in range(1, st.nrows)]

    # 3.将表名追加到列表作为第一个元素
    title = open_file.sheet_names()
    data = title + data

    return data


def write_data(path, data):
    index = len(data) # 获取索引写入的行数
    workbook = xlrd.open_workbook(path) # 打开工作簿
    sheets = workbook.sheet_names()  # 获取工作簿中的所有表格
    worksheet = workbook.sheet_by_name(sheets[0])  # 获取工作簿中所有表格中的的第一个表格
    cols_old = worksheet.ncols  # 获取表格中已存在的数据的列数

    new_workbook = copy(workbook)  # 将xlrd对象拷贝转化为xlwt对象
    new_worksheet = new_workbook.get_sheet(0)  # 获取转化后工作簿中的第一个表格
    for i in range(0, index):
            new_worksheet.write( i, cols_old + 2, data[i])  # 追加写入数据		
    new_workbook.save(path)  # 保存工作簿
		

def get_file_name(file_dir):
    tmp_lst = []
    for root, dirs, files in os.walk(file_dir):
        for file in files:
            tmp_lst.append(os.path.join(root, file))
    return tmp_lst

def main():
    DIR_NAME = r'E:\test\\'
    create_excel(DIR_NAME + '合并.xls','汇总数据')
    print(DIR_NAME + '合并.xls')
    tmp_list = get_file_name(DIR_NAME + 'data\\')
    for dir in tmp_list:
        data = read_data(dir)
#        data1 = read_data1(dir)
        write_data(DIR_NAME + '\合并.xls', data)
#        write_data(DIR_NAME + '\合并.xls', data)
        print('------------'+ dir.split("\\")[-1] + '数据写入成功！-----------' )

if __name__ == '__main__':
    main()