pandas的factorize方法简介

factorize具体是做什么的,这个不好描述,先让我用个例子做个说明。

>>> import pandas as pd
>>> labels, uniques = pd.factorize(['b', 'b', 'a', 'c', 'b'])
>>> labels
array([0, 0, 1, 2, 0], dtype=int64)
>>> uniques
array(['b', 'a', 'c'], dtype=object)

如上述代码,在对一个列表调用了fatorize方法后,返回了一个元祖。uniques返回的是对应列表去重后的值。labels返回的是列表中每个元素在uniques中的位置。

当然你还可以添加sort参数作为入参,默认会对uniques中的值进行排序

>>> labels, uniques = pd.factorize(['b', 'b', 'a', 'c', 'b'], sort=True)
>>> labels
array([1, 1, 0, 2, 1])
>>> uniques
array(['a', 'b', 'c'], dtype=object)

如果列表中包含None,uniques会把他忽略掉,并在列表中标为-1

>>> labels, uniques = pd.factorize(['b', None, 'a', 'c', 'b'])
>>> labels
array([ 0, -1,  1,  2,  0])
>>> uniques
array(['b', 'a', 'c'], dtype=object)

哈哈,以上就是关于factorize函数的介绍,还是挺有用的。有兴趣欢迎关注python小工具,一起学习python和pandas
在这里插入图片描述

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值