目录
删除重复数据
students.drop_duplicates()
students.drop_duplicates(subset='Name',inplace=True,keep='first')#keep选择表示删除前面或后面的数据
print(students)
如果要基于多列删除,subset=['xx','yy'] 给一个list
dupe=students.duplicated(subset='Name')
print(dupe)
结果:True表示“是重复数据”
18 False
19 False
20 False
21 True
22 True
23 True
24 True
25 True
dtype: bool
是一个bool型的series
是否存在重复数据
print(dupe.any())
结果:
True #表示存在重复数据