最近工作需要用到把Excel中的重复数据查找,一个Excel文件一般几万条数据,不好查找,然后就用python的pandas库写了个脚本,查找起来就方便很多,也是丰富自己知识,学习的一个过程。
# 欢迎添加 vx公众号 小刘和他的Python 一起学习
import pandas as pd
df = pd.read_excel(r"D:/dup/dept.xls",usecols=[1,2],sheet_name="Sheet1")
dup=df.duplicated()
print("重复数据:\n",df[dup])
usecols=[1,2] 表示查找的数据列为年龄列和籍贯列,列数据编号重0开始,姓名列编号为0
sheet_name=“Sheet1” 表示查询的数据为sheet1 页的数据