sklearn onehot编码

最新推荐文章于 2022-12-14 19:34:38 发布

goodxin_ie

最新推荐文章于 2022-12-14 19:34:38 发布

阅读量1.2k

点赞数

分类专栏： sklearn 文章标签： sklearn onehot 机器学习

本文链接：https://blog.csdn.net/goodxin_ie/article/details/109705964

版权

sklearn onehot编码解读https://www.cnblogs.com/Jerry-home/p/9824085.html

根据训练数据统计特征每一维度的状态数（n_values_属性）
根据每一维度的状态数计算该特征所需位数，然后将各维度特征进行onehot编码之后拼接起来（feature_indices_则是各维特征在onehot编码中的起始索引）

from sklearn import preprocessing
feature = [['红','重','长'],['黑','轻','长'],['白','重','短'],['白','重','中']]
coder = preprocessing.OneHotEncoder()
coder.fit(feature)

x = [['白','重','短'],['白','重','中']]
coder.transform(x).toarray()

#3个特征分别占据3,2,3位
Out[16]: 
array([[1., 0., 0., 0., 1., 0., 1., 0.],
       [1., 0., 0., 0., 1., 1., 0., 0.]])

解读一下OneHotEncoder函数

OneHotEncoder(n_values=None,  
                        categorical_features=None,

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

goodxin_ie

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sklearn onehot编码

sklearn onehot编码解读https://www.cnblogs.com/Jerry-home/p/9824085.html根据训练数据统计特征每一维度的状态数（n_values_属性）根据每一维度的状态数计算该特征所需位数，然后将各维度特征进行onehot编码之后拼接起来（feature_indices_则是各维特征在onehot编码中的起始索引）from sklearn import preprocessingfeature = [['红','重','长'],['黑','轻','
复制链接

扫一扫