在工作中,我们可能要对比两列数据,找到其中一列缺失了哪些值,肉眼的去找会很费时间,但是用python就会很快
例如下面的表格
import pandas as pd
# 读取Excel文件并指定Sheet名称
file_path = 'path_to_your_file.xlsx' # 替换为您的文件路径
sheet_name = 'Sheet1' # 替换为您的Sheet名称
df = pd.read_excel(file_path, sheet_name=sheet_name)
# 假设两列的名称分别为'Column_A'和'Column_B'
column_a = df['Column_A']
column_b = df['Column_B']
# 找出Column_A中有但Column_B中没有的值
missing_in_b = column_a[~column_a.isin(column_b)]
# 找出Column_B中有但Column_A中没有的值
missing_in_a = column_b[~column_b.isin(column_a)]
print("Column_A中有但Column_B中没有的值:")
print(missing_in_b)
print("Column_B中有但Column_A中没有的值:")
print(missing_in_a)
例如我用我的表格运行出来的结果是这样显示在控制台
Column_A中有但Column_B中没有的值:
51 4FGL J0334.2-3725
83 4FGL J0702.7-1951
90 4FGL J0747.3-3310
92 4FGL J0754.4-1148
113 4FGL J0844.9-5458
115 4FGL J0850.0+4855
151 4FGL J1103.9-5357
189 4FGL J1305.6+7853
192 4FGL J1326.8-5256
195 4FGL J1331.6+1711
200 4FGL J1415.5+4830
233 4FGL J1604.5-4441
244 4FGL J1717.5-3342
271 4FGL J2029.5+4925
Name: Source_Name, dtype: object