使用numpy进行工作簿中多个表的数据汇总

在Excel中工作簿2016.xlsx中有三个表,Sheet1,Sheet2,Sheet3,分别存有一点数据,现在要把三个表汇总到一张表中存入工作簿。

import pandas as pd
import xlrd
from pandas import DataFrame


#得到工作簿
wb = xlrd.open_workbook('2016.xlsx')

#工作簿中的表
sheets = wb.sheet_names()

#遍历表名,将表中的数据汇总到
total = DataFrame()#容器

for i in range(len(sheets)):
	df = pd.read_excel('2016.xlsx',sheetname=sheets[i],encoding='utf8',skiprows=0)
	print('数据维度:',df.shape)
	print('元素个数:',df.size)
	total = total.append(df)
print('total:',total)

# 保存到一个工作表中
wb = pd.ExcelWriter('new2016.xlsx')
total.to_excel(wb,'Sheet1')
wb.save()
1. 使用Python处理多数据整合、匹配、分析 Python是一种功能强大的编程语言,特别适合用于数据处理和分析。它可以处理各种数据格式,包括Excel格、CSV文件、JSON、XML等等。Python有许多库可以帮助我们处理多个格之间的数据整合、匹配和分析,比如pandas、numpy、matplotlib等。 以下是使用Python进行数据整合、匹配、分析的一般步骤: 1.1 数据读取 首先,我们需要将所有需要处理的格读入Python。这可以使用pandas库的read_excel()、read_csv()等函数来完成。 例如,我们有两个Excel格,分别为“格1.xlsx”和“格2.xlsx”,我们可以使用以下代码将其读入Python: import pandas as pd df1 = pd.read_excel('格1.xlsx') df2 = pd.read_excel('格2.xlsx') 1.2 数据整合 接下来,我们需要将多个数据整合到一起。这可以使用pandas库的merge()函数进行操作。merge()函数可以将两个格按照指定的列进行合并,并且可以指定合并方式(inner、outer、left、right)。 例如,我们可以将df1和df2按照“编号”列进行合并,合并方式为“inner”,代码如下: df = pd.merge(df1, df2, on='编号', how='inner') 1.3 数据匹配 合并之后,我们可能需要对数据进行匹配。匹配可以使用pandas库的merge()函数进行操作,也可以使用Series对象的map()方法进行操作。 例如,我们可以将df的“性别”列的“男”和“女”分别替换为1和0,代码如下: df['性别'] = df['性别'].map({'男': 1, '女': 0}) 1.4 数据分析 最后,我们可以使用pandas、numpy、matplotlib等库对整合和匹配后的数据进行分析和可视化。 例如,我们可以使用pandas库的groupby()函数对数据进行分组,并计算每组的平均值和标准差,代码如下: df_grouped = df.groupby('城市')['销售额'].agg(['mean', 'std']) 这将返回一个新的DataFrame对象,其包含每个城市的平均销售额和销售额的标准差。 2. 使用Excel和VBA处理多数据整合、匹配、分析 除了Python,我们还可以使用Excel和VBA来处理多个格之间的数据整合、匹配和分析。Excel和VBA具有易于使用和广泛适用的优点,适合用于快速处理小型数据集。 以下是使用Excel和VBA进行数据整合、匹配、分析的一般步骤: 2.1 数据整合 首先,我们需要将多个格整合到一个Excel工作簿。这可以使用Excel的“复制”和“粘贴”功能来完成。例如,我们可以将“格1.xlsx”和“格2.xlsx”的所有数据复制到一个新的Excel工作簿。 2.2 数据匹配 接下来,我们可以使用Excel的“查找和替换”功能来对数据进行匹配。例如,我们可以将工作簿的“性别”列的“男”和“女”分别替换为1和0。 2.3 数据分析 最后,我们可以使用Excel的各种函数和工具对数据进行分析和可视化。例如,我们可以使用Excel的“数据透视”功能对数据进行汇总和统计,并使用Excel的图功能创建各种图来可视化数据。 如果需要更复杂的数据处理和分析操作,我们可以使用VBA编写自定义脚本来自动化处理过程。例如,我们可以编写一个VBA脚本来自动执行数据整合、匹配和分析操作,并将结果输出到新的Excel工作簿
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值