我这边的有一组新数据和一组旧数据new,old
用Pandas可以快速将new中已存在于old的数据分离出来
b = new.isin(old)[数据所在列名] # 判断哪些地块已经存在于数据库
existed_data = new[b==True] # 已存在的数据
new_data = new[b==False] # 不存在的新数据
举例如下:
新数据
new
Out[111]:
a b
0 1 2
1 3 4
2 6 1
3 4 1
旧数据
old
Out[112]:
a b
0 6 88
1 7 4
2 3 3
3 4 1
代码
b = new.isin(old)['b'] # 判断哪些地块已经存在于数据库
existed_data = new[b==True] # 已存在的数据
new_data = new[b==False] # 不存在的新数据
结果:
existed_data
Out[113]:
a b
1 3 4
3 4 1
new_data
Out[114]:
a b
0 1 2
2 6 1