用python进行简单的excel表格分析

今天测试要对比新旧数据,然后添加新增数据,叫我帮忙弄。我靠几千条数据怎么可能一条条筛选。就打算试试用python弄一下,对比java的poi进行的excel处理的确简单好多。很快就上手了。

1,导入包
pip install pandas
pip install xlrd
2,问题分析
  我将要对比的数据分别放到了1.xls和2.xls里面。
  分别用两个集合装下各自第一排的数据,(类似id有唯一性)。
  因为1.xls里面数据多于2.xls。
 要分析添加了那些数据,我只需要输出有哪些是1中多出来的就行了。
import  pandas as pd


df1 = pd.read_excel('1.xls',header=None)
df2 = pd.read_excel('2.xls',header=None)


# 获取第一列并转化为列表
pros_list = df2[0].values.tolist()
pros_list2 = df1[0].values.tolist()
# print(pros_list)

for index in range(len(pros_list)):
     if  pros_list[index] in pros_list2:
         pass
     else:
         print(pros_list[index])

结果如下,感觉python还是简单易用的。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值