sklearn.preprocessing OneHotEncoder——仅仅是数值型字段才可以，如果是字符类型字段则不能直接搞定...

最新推荐文章于 2023-08-31 16:50:41 发布

djph26741

最新推荐文章于 2023-08-31 16:50:41 发布

阅读量189

点赞数

文章标签：人工智能 python

原文链接：http://www.cnblogs.com/bonelee/p/7805894.html

版权

>>> from sklearn.preprocessing import OneHotEncoder
>>> enc = OneHotEncoder()

>>> enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])  

>>> enc.n_values_
array([2, 3, 4])

>>> enc.feature_indices_
array([0, 2, 5, 9]) >>> enc.transform([[0, 1, 1]]).toarray() array([[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]])

注意：仅仅是数值型字段才可以，如果是字符类型字段则不能直接搞定

需要使用pandas get_dummies搞定

例如：

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码

pd.get_dummies(df)


还可以：

import pandas as pd
import numpy as np
from sklearn_pandas import DataFrameMapper
from sklearn.preprocessing import OneHotEncoder

data = pd.DataFrame({'text':['aaa', 'bbb'], 'number_1':[1, 1], 'number_2':[2, 2]})

#    number_1  number_2 text
# 0         1         2  aaa
# 1         1         2  bbb

# SomeEncoder here must be any encoder which will help you to get
# numerical representation from text column
mapper = DataFrameMapper([
    ('text', SomeEncoder),
    (['number_1', 'number_2'], OneHotEncoder())
])
mapper.fit_transform(data)

转载于:https://www.cnblogs.com/bonelee/p/7805894.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

djph26741

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sklearn.preprocessing OneHotEncoder——仅仅是数值型字段才可以，如果是字符类型字段则不能直接搞定...

>>> from sklearn.preprocessing import OneHotEncoder>>> enc = OneHotEncoder()>>> enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]]) >>> enc.n_v...
复制链接

扫一扫