sklearn onehot编码

sklearn onehot编码解读https://www.cnblogs.com/Jerry-home/p/9824085.html

  1. 根据训练数据统计特征每一维度的状态数(n_values_属性)
  2. 根据每一维度的状态数计算该特征所需位数,然后将各维度特征进行onehot编码之后拼接起来(feature_indices_则是各维特征在onehot编码中的起始索引)
from sklearn import preprocessing
feature = [['红','重','长'],['黑','轻','长'],['白','重','短'],['白','重','中']]
coder = preprocessing.OneHotEncoder()
coder.fit(feature)

x = [['白','重','短'],['白','重','中']]
coder.transform(x).toarray()

#3个特征分别占据3,2,3位
Out[16]: 
array([[1., 0., 0., 0., 1., 0., 1., 0.],
       [1., 0., 0., 0., 1., 1., 0., 0.]])

解读一下OneHotEncoder函数

OneHotEncoder(n_values=None,  
                        categorical_features=None, 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值