drop_duplicates()函数

1dataframe删除某一列的重复元素,默认只留下第一次出现的

inplace参数设置为true时直接在原数据上修改,为False时,生成副本.

注意所有函数中inplace一旦设置为True,此时后面不能再跟任何函数,因为它整体已经是None.想要再跟函数只能再写一行.

且此时在前面也不能赋值,赋值也是None.因为设置为True时,整体是None,设置为False时,整体是一个引用,可以赋给其它变量.

a1 = pd.DataFrame({
                    'a': [1, 1, 3, 2,],
                    'b': [1, 1, 6, 4,],
                    'c': [1, 1, 3, 9,]
                  })
print(a1)
a1.drop_duplicates(inplace=True)
print(a1)
# 这里inplace为假,整体实际上是一个引用,所以可以直接输出.
print(a1.drop_duplicates(['a','b'], keep='first',inplace=False))
# 注意这里因为inplace为真,直接在原数据上修改,直接输出是空,因为它并不是一个引用,a1才是引用.
print(a1.drop_duplicates(['a','b'], keep='first',inplace=True))
#    a  b  c
# 0  1  1  1
# 1  1  1  1
# 2  3  6  3
# 3  2  4  9
#    a  b  c
# 0  1  1  1
# 2  3  6  3
# 3  2  4  9
#    a  b  c
# 0  1  1  1
# 2  3  6  3
# 3  2  4  9
# None

 

 https://blog.csdn.net/qq_28811329/article/details/79962511

 test_sample_quchong = test_sample.drop_duplicates(['ggid'])利用 data.drop_duplicates()#data中一行元素全部相同时才去除可检查dataframe是否有重复的行
 参考:   https://www.cnblogs.com/mahailuo/p/8317178.html

转载于:https://www.cnblogs.com/xxswkl/p/10989306.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值