pandas.facctorize

pandas.factorize用法

对标签进行数值编码(相当于label-encoding),按照标签在data中出现的先后顺序。

import pandas as pd 
data = pd.DataFrame()
data['text'] = ['x1','x2','x3','xx']
data['label'] = ['花','草','树','木']
print(data)
'''
  text label
0   x1     花
1   x2     草
2   x3     树
3   xx     木
'''
data['label_encoding'],lbl = pd.factorize(data['label'])
print(data)
'''
  text label  label_encoding
0   x1     花               0
1   x2     草               1
2   x3     树               2
3   xx     木               3
'''
print(lbl)
'''
Index(['花', '草', '树', '木'], dtype='object')
'''

print(lbl[1])
# 草
print(lbl[0])
# 花
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值