one-hot 编码 preprocessing.OneHotEncoder()

最新推荐文章于 2022-04-02 23:20:32 发布

空城gang

最新推荐文章于 2022-04-02 23:20:32 发布

阅读量1.8k

点赞数

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/ganghaodream/article/details/103756969

版权

数据挖掘专栏收录该内容

2 篇文章 0 订阅

订阅专栏

from sklearn import preprocessing
enc = preprocessing.OneHotEncoder()
enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
enc.transform([[0, 1, 3]]).toarray()

有3列，每列为一个特征：

0	0	3
1	1	0
0	2	1
1	0	2

第一列的取值为 01

第二列的取值为 01 2

第二列的取值为 01 2 3

所以对应的【0 1 3】的one-hot 编码为 10 010 0001

如果还不理解比如：男女 10为男 01为女

再举一个例子：

from sklearn import preprocessing
data = [["男", "北京", "1"], ["女", "2", "1"], ["女", "1","2"], ["男", "2", "3"]]
enc=preprocessing.OneHotEncoder()
encoder = enc.fit(data)
m=enc.transform([["男", "北京", "1"]]).toarray()
print(m)

输出：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

空城gang

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
one-hot 编码 preprocessing.OneHotEncoder()

from sklearn import preprocessingenc = preprocessing.OneHotEncoder()enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]]) enc.transform([[0, 1, 3]]).toarray()有3列，每列为一个特征：0 0 3 1 ...
复制链接

扫一扫