最近在倒腾一些表格数据,遇到这么个问题:先前下载了一批数据,等再次更新下载时,数目却变少了,我需要快速定位到缺失的条目并探究原因。
如图,左侧 10 条数据是先前下载的,右侧少了 1 条(数据是随便编的):
Python 操作
因为对 Excel 的函数操作不太熟,第一时间我是用 Python 来比对数据的:选取两份表格中的 id 列,分别复制到两份 txt 文档中,转化为 Python 读取 txt 文档数据、列表的相关操作问题。
# 读取两文档中的id数据
with open("001.txt","r") as f:
data1 = f.readlines()
# data1 为 ['20\n', '12\n', '73\n', '44\n', '5\n', '96\n', '127\n', '28\n', '9\n', '1']
with open("002.txt","r") as f:
data2 = f.readlines()
# data2 为 ['9\n', '