python 如何将字符串转换为编码类型

本文介绍了在使用Python的scikit-learn库时,如何处理字符串变量并将其转换为编码类型以适应模型的要求。强调了在处理训练集和测试集时编码的一致性问题。
摘要由CSDN通过智能技术生成

在python的scikit-learn中,模型不支持字符串的变量进行运算(尽管在pandas和numpy中是支持的),这就要求我们自己来转换类型。
当多个变量存在字符串类型需要转换数字时,我们可以定义编码函数:

def label_encoder(series):
	 cat = series.value_count(dropna=False) #统计出现次数
	 return  {k:v for k,v in zip(cat.index,range(len(series)))} # zip迭代输出

将所有变量进行编码,其中要保持测试集和训练集编码一致:

for i in x_d:
   encoder = label_encoder(train[i])
   ##用replace进行替换
   train[i].replace
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值