我有一个Excel(.xlsx)文件,大约有40个工作表。每个工作表具有相同的结构,但包含不同的数据。我想从每张表格中提取信息,并将其合并到一张表格中,每张表格中的信息一张叠一张地叠在一起。我需要从每一个中提取两个信息:工作表名称,总是在单元格E3中找到
感兴趣的单元格区域,始终位于第72-85行和第E-V列之间
提取的信息将被粘贴到合并表的第2-15行中,其中一列包含工作表名称,旁边的列中包含所有其他信息。然后,从下一页提取的信息将被粘贴到第16-29行,依此类推。在
我是Python新手,正在运行python3.6.1。我已经找到了如何使用Python组合Excel文件的解决方案,但没有从Excel工作表中的指定单元格中提取信息片段。在
任何指导都会很有帮助。在
更新1:我使用将我的一张表的区域加载到数据框中。在import pandas as pd
cis = pd.ExcelFile(r"C:\mypath\myfile.xlsx")
df1 = cis.parse('1. Consumers', skiprows=[0,1,2,3,4,5,6],parse_cols=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]).drop([13])
但是,我仍然需要将工作表名称添加到数据框中,然后在所有工作表上运行相同的循环,最后将每个工作表中的信息附加到一个数据帧/文件中。在