【写在前面:本篇文章是介绍的一个小作业,利用python对excel中的数据进行处理。这里数据就不公开了。本篇文章有两个目的,一是作为学习记录,二是希望对大家有点帮助,对于不足之处,也希望各路大佬可以不吝赐教。本文为作者原创文章,文中所示的图片、代码皆来自网络或笔者自制,仅做学习、记录使用,如果某些东西涉及侵权,请作者大大告知笔者,可以对此进行补充说明。如有人私自引入商业使用构成侵权或违法犯罪,则笔者概不负责。】
一、目标任务
将类似图中这样的表格,转换成第二张图所示的形式
当然,对于这种表格,我们也可以直接使用excel完成,但笔者还是想用python练练手,所以就写了下面的代码。
大致思路就是一个寻找匹配的方法,找到对应的行列,提取出第 i 行第 j 列中的对应信息,然后将其输入到表二中的对应单元格中。大致就是以表二作为目标表格和目标行、列索引,对表一进行检索。代码应该蛮好懂的,就不多说了。
二、完整代码
编译器:jupyter notebook
numpy:1.18.4
pandas:0.25.1
matplotlib:3.2.1
import numpy as np
import pandas as pd
from pandas import DataFrame,Series
# 导入数据
data = pd.read_excel('数据处理.xlsx',sheet_name='分栏处理',header= None)
data
data2 = pd.read_excel('数据处理.xlsx',sheet_name='表格形式')
data2.set_index('Unnamed: 0',inplace = True) #列索引处理
data2
# 数据清洗,检查对应的数据格是否有数据
check = data.isnull()
check
# 遍历导入表2
for i in range(803):
row_information = []
if(check[1][i]):
pass
else:
for j in range(3):
row_information.append(data[j][i])
data2[row_information[1]][row_information[0]] = row_information[2]
data2
# 输出表格
from openpyxl import load_workbook
book = load_workbook('数据处理.xlsx')
writer = pd.ExcelWriter('数据处理.xlsx', engine='openpyxl')
writer.book = book
data2.to_excel(writer, '表格形式')
writer.save()