python数据处理_python数据处理与分析:判定与统计

23679eac5ac726d9287d35f293e67707.png

一起学习,一起成长!

前言

唯一值处理、值统计、成员资格判定,是数据处理中常用的方法。

唯一值可以解决数据重复性问题,进行数据去重操作。有过数据分析经验的朋友一定清楚,数据分析过程中,数据去重的应用场景以及重要性。

值计数也是常用功能之一,经常与唯一值功能结合使用。通常需要先对数据进行唯一值处理后,进行值计数统计。

成员资格,通常解决在数据中是否存在某值。主要用来判断是否存在对一个重要手法。

接下来,小编带领大家一同来学习,如何用python来进行唯一值处理、值统计、成员资格判定。均是干获,记得收藏关注哦!

唯一值:unique()

计算series中的唯一值数组,按发现的顺序返回。

书写方式:obj.unique()

返回的唯一值是未排序的,如果要再次进行排序,可以使用unique.sort()。

值计数:value_counts()

返回一个Series,其索引为唯一值,其值为频率,按计数值降序排列。

#按值频率降序排列,value_counts还是一个顶级pandas方法

书写方式:obj.value_counts(obj.values,sort=False)

成员资格:isin()

计算一个表示“Series各值是否包含于传入的值序列中”的布尔型数组。

书写方式:obj.isin([‘b’,’c’])

Isin用于判断矢量化集合的成员资格,可用于选取Series中或DataFrame列中的数据的子集。

「亲,如果笔记对您有帮助,收藏的同时,记得给点个赞、加个关注哦!感谢!」

「文中代码均亲测过,若有错误之处,欢迎批评指正,一起学习,一起成长!」

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值