pandas.duplicated()和.drop_duplicates()

最新推荐文章于 2024-06-18 22:11:25 发布

Sunyl_01

最新推荐文章于 2024-06-18 22:11:25 发布

阅读量183

点赞数

本文链接：https://blog.csdn.net/Sunyl_01/article/details/117959560

版权

参数：
subset=None：列标签或标签序列

df.duplicated('a1')

df.duplicated(['a1','a2'])

keep=‘first’：{‘first’，‘last’，False}

# - first：将第一次出现重复值标记为True
# - last：将最后一次出现重复值标记为True
# - False：将所有重复项标记为True

参数：同上

inplace=False

False 为创建副本，原数据不替换

Ture 为替换原数据

重复值处理完后，index会有不连续，可通过reindex()方法可以完成连续索引操作

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注