今天测试要对比新旧数据,然后添加新增数据,叫我帮忙弄。我靠几千条数据怎么可能一条条筛选。就打算试试用python弄一下,对比java的poi进行的excel处理的确简单好多。很快就上手了。
1,导入包
pip install pandas
pip install xlrd
2,问题分析
我将要对比的数据分别放到了1.xls和2.xls里面。
分别用两个集合装下各自第一排的数据,(类似id有唯一性)。
因为1.xls里面数据多于2.xls。
要分析添加了那些数据,我只需要输出有哪些是1中多出来的就行了。
import pandas as pd
df1 = pd.read_excel('1.xls',header=None)
df2 = pd.read_excel('2.xls',header=None)
# 获取第一列并转化为列表
pros_list = df2[0].values.tolist()
pros_list2 = df1[0].values.tolist()
# print(pros_list)
for index in range(len(pros_list)):
if pros_list[index] in pros_list2:
pass
else:
print(pros_list[index])
结果如下,感觉python还是简单易用的。