Python数据分析数据可视化-----学了就会的Pandas数据去重及替换

最近期中考试来啦,所以更新也不是很及时了,但是没关系,更新可能会迟到,但不会缺席!
这篇博客写一下数据的去重和替换以及数据分组
(1)去重—.duplicated
数据的去重就是去除数据中重复的部分,pandas中主要是通过duplicated来实现

创建Series数据

s = pd.Series([1,1,1,1,2,2,2,3,4,5,5,5,5])
print(s)

输出结果:
在这里插入图片描述
判断是否重复,重复的话返回True

print(s.duplicated())

输出结果:
在这里插入图片描述
筛选不重复的值

print(s[s.duplicated() == False])

输出结果:
在这里插入图片描述
我们可以找到重复的值,也可以移除重复的值,通过drop_duplicates( ) 来实现,参数默认为False,不替换原值

s_re = s.drop_duplicates()
print(s_re)

输出结果:
在这里插入图片描述
再来看一下在Dataframe中使用duplicated

df = pd.DataFrame({'key1':['a','a',3,4,5],
                  'key2':['a','a','b','b','c']})
print(df.duplicated())
print(df['key2'].duplicated())

输出结果:
在这里插入图片描述
(2)替换----replace
我们可以替换数组中的某些值,通过replace来实现
创建Series数组

s = pd.Series(list('ascaazsd'))
print(s)

输出结果:
在这里插入图片描述
把‘a’替换成空值

print(s.replace('a', np.nan))

输出结果:
在这里插入图片描述
把‘a’替换成‘hello world!’,把‘s’替换成‘123’

print(s.replace({'a':'hello world!','s':123}))

输出结果:
在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值