one-hot-encode编码方式

有时特征内容并不是数值,而是字符串类型。如果直接将字符串转成一个对应的数值,造成原本的特征具有大小关系。这是需要使用 one-hot-encode编码格式。

两种转化方式:

pandas.get_dummies():常用方法,功能强大,操作简单;
sklearn.preprocessing.OneHotEncoder():用法复杂且易报错,较少使用。
pandas.get_dummies(data, columns=["one","two",...], dummy_na=False, ...) 
# columns : 需处理的列逐个填写
# dummy_na : 是否将NA作为新的分类

sklearn.preprocessing.OneHotEncoder()使用时需将列的类型转成str类型。一般类的dtype如果是object,OneHotEncoder时会报错,因为object是混合类型,需将类型转换成str类型。
--------------------- 
作者:scxyz_ 
来源:CSDN 
原文:https://blog.csdn.net/sscc_learning/article/details/73719019 
版权声明:本文为博主原创文章,转载请附上博文链接!

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值