bqw的博客

没什么描述

Pandas:移除重复数据
import pandas as pd
import numpy as np
from pandas import Series,DataFrame

一、unique:只能应该与Series

s = Series(['a','b','a','c','b'])
s.unique()
array(['a', 'b', 'c'], dtype=object)

二、drop_duplicates

1.Series

s.drop_duplicates()
0    a
1    b
3    c
dtype: object

2.DataFrame

df = DataFrame({'水果':['苹果','草莓','苹果'],
               '价格':[3,9,3],
               '数量':[5,6,5]})
print(df.drop_duplicates())
   价格  数量  水果
0   3   5  苹果
1   9   6  草莓

按指定列去重复

print(df.drop_duplicates('水果'))
   价格  数量  水果
0   3   5  苹果
1   9   6  草莓

三、duplicated:判断行是否重复

df.duplicated()
0    False
1    False
2     True
dtype: bool
阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/bqw18744018044/article/details/79963344
个人分类: Pandas
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

不良信息举报

Pandas:移除重复数据

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭