preprocessing.LabelBinarizer()返回的结果不是one-hot怎么解决？

象牙塔小明

已于 2022-11-07 19:09:47 修改

阅读量293

点赞数

分类专栏： Scikit_learn 文章标签： sklearn 人工智能 python

于 2022-09-15 14:25:27 首次发布

本文链接：https://blog.csdn.net/u014571489/article/details/126870577

版权

Scikit_learn 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

先来看一个符合预期的代码，输出one-hot编码：

from sklearn import preprocessing
lb = preprocessing.LabelBinarizer()
lb.fit_transform(range(0, 3))

输出:
array([[1, 0, 0],
[0, 1, 0],
[0, 0, 1]])

再看一个神奇的案例，把上面的代码3改成2:

from sklearn import preprocessing
lb = preprocessing.LabelBinarizer()
lb.fit_transform(range(0, 2))

输出:
array([[0],
[1]])

结果不是one-hot编码？？？

解决方法:

from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder()
enc.fit_transform([['yes'], ['no'], ['no'], ['yes']]).toarray()

输出：
array([[0., 1.],
[1., 0.],
[1., 0.],
[0., 1.]])

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

象牙塔小明

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python编程之sklearn.preprocessing.LabelBinarizer()的用法解析

信徒博客

01-17

3870

疑惑 sklearn.preprocessing.LabelBinarizer()是干嘛用的？解惑 one-hot编码转换的一个方法什么是one-hot? 举个例子，你就知道了：二进制表示法，不同的是在二进制中1代表0 0 0 1，但是在这里是1 0 0 0 整数1表示在索引对应的位置；疑问：日本写在第二，应该是0 1 0 0怎么是 0 0 1 0呢？解惑：这...

sklearn.preprocessing.LabelBinarizer

每天进步一点点2017

07-13

5582

标签二值化：sklearn.preprocessing.LabelBinarizer(neg_label=0, pos_label=1,sparse_output=False)主要是将多类标签转化为二值标签，最终返回的是一个二值数组或稀疏矩阵参数说明： neg_label：输出消极标签值 pos_label：输出积极标签值 sparse_output：设置True时，以行压缩格式

2 条评论您还未登录，请先登录后发表或查看评论

机器学习：数据预处理之LabelBinarier()

JacksonKim的博客

04-17

3069

classsklearn.preprocessing.LabelBinarizer(neg_label=0,pos_label=1,sparse_output=False) fit(self,y) 设定或者初始化二进制分类器 fit_transform(self,y) 设定或者初始化二进制分类器并开始对y进行转换 ...

机器学习之sklearn.preprocessing.LabelBinarizer()的用法

进阶的小宋

09-07

1520

自己动手的第一个机器学习算法 from sklearn import preprocessing feature = [[0,1], [1,1], [0,0], [1,0]] label= ['yes', 'no', 'yes', 'no'] lb = preprocessing.LabelBinarizer() #构建一个转换对象 Y = lb.fit_transform(label) re_label = lb.inverse_transform(Y) print(Y) print(re_label)

sklearn.preprocessing.MultiLabelBinarizer

每天进步一点点2017

07-13

1万+

多标签二值化：sklearn.preprocessing.MultiLabelBinarizer(classes=None, sparse_output=False) classes_属性：若设置classes参数时，其值等于classes参数值，否则从训练集统计标签值 ①classes默认值，classes_属性值从训练集中统计标签值 In [1]: from sklearn.prepro

LabelBinarizer进行单分类和多分类one-hot编码

wj1298250240的博客

12-18

1340

LabelBinarizer进行单分类和多分类one-hot编码 5.1 Encoding Nominal Categorical Feature¶ feature # 加载库使用LabelBinarizer 进行one-hot编码 import numpy as np from sklearn.preprocessing import LabelBinarizer, MultiLabel...

文本特征提取——one-hot

weixin_51117061的博客

11-25

1684

独热编码即 One-Hot 编码，又称一位有效编码。其方法是使用 N位状态寄存器来对 N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候，其中只有一位有效。 One-Hot 编码是分类变量作为二进制向量的表示。(1) 将分类值映射到整数值。(2) 然后，每个整数值被表示为二进制向量，除了整数的索引之外，它都是零值，它被标记为1。是一种十分常用的类别处理手段，当特征是离散的，无序的，就可以通过one hot 进行特征数字化，比如一个特征有高、中、低三个值，通过独热编码，就可以分...

python中的scaler_Python preprocessing.MaxAbsScaler方法代码示例

weixin_39517902的博客

12-10

1073

本文整理汇总了Python中sklearn.preprocessing.MaxAbsScaler方法的典型用法代码示例。如果您正苦于以下问题：Python preprocessing.MaxAbsScaler方法的具体用法？Python preprocessing.MaxAbsScaler怎么用？Python preprocessing.MaxAbsScaler使用的例子？那么恭喜您, 这里精选的...

解决sklearn Pipeline与LabelBinarizer不兼容报错

微信公众号: 序日新说 QQ交流群: 921673324

03-05

766

错误的示例 TypeError: fit_transform() takes 2 positional arguments but 3 were given from sklearn.pipeline import Pipeline from sklearn.preprocessing import LabelBinarizer cat = ['序', '日', '新', '说'] pipe...

将标签转为onehot形式

ljp1919的专栏

03-25

2054

背景对于给定具体标签,如何将其转为one-hot形式？比如标签集合体育', '娱乐', '家居', '房产', '教育', '时尚', '时政', '游戏', '科技', '财经'，对于multiclass任务，如何将训练数据集中的样本的标签转为one-hot形式？方法1： import numpy as np label_list = ['体育', '娱乐', '家居', '房产', '教育', '时尚', '时政', '游戏', '科技', '财经'] label_dict

标签二值化LabelBinarizer

和而不流

08-30

3万+

对于标称型数据来说，preprocessing.LabelBinarizer是一个很好用的工具。比如可以把yes和no转化为0和1，或是把incident和normal转化为0和1。当然，对于两类以上的标签也是适用的。这里举一个简单的例子，说明将标签二值化以及其逆过程。# -*- coding: UTF-8 -*- from sklearn import preprocessing from skl

【特征工程】分类变量：MultiLabelBinarizer对多标签数据进行编码

热门推荐

KI的博客

07-28

9万+

使用决策树（decision-tree）预测隐形眼镜类型（标签二值化（LabelBinarizer）复原输出）

所涉及到的几种 sklearn 的二值化编码函数：OneHotEncoder(), LabelEncoder(), LabelBinarizer(), MultiLabelBinarizer()

知之可否

02-14

1万+

转自http://blog.csdn.net/haramshen/article/details/53169963 所涉及到的几种 sklearn 的二值化编码函数：OneHotEncoder(), LabelEncoder(), LabelBinarizer(), MultiLabelBinarizer() 1.代码块 import pandas as pd from sklear

【Python机器学习】零基础掌握LabelBinarizer数据预处理

Mr数据杨

11-09

298

LabelBinarizer 是一种简便的工具，用于将分类数据转换为机器学习算法可理解的二进制格式。在城市绿化等级智能分类案例中，该工具帮助将植被种类的文本标签转换为模型易于处理的数值数据，实现了对不同绿化区域的高效分类。这不仅提高了数据处理速度，也使得结果更加直观易懂。优点总结，使用 LabelBinarizer，可以将分类标签转换为二进制格式，简化了数据预处理步骤。其操作简单，适用于各种机器学习模型，特别是那些要求输入为数值型数据的模型。它支持稀疏输出，有助于处理大规模数据集，减少内存占用。优点名称。

LabelEncoder、LabelBinarizer、OneHotEncoder三者的区别

RivenDong

08-28

1914

LabelEncoder、LabelBinarizer、OneHotEncoder三者的区别 import numpy as np from sklearn.preprocessing import LabelEncoder, LabelBinarizer, OneHotEncoder test_data = np.array(["a", "b", "c", "d", "a"]) print(L...

对y_true进行二分类编码，将其转化为0和1的形式，可以使用sklearn中的LabelBinarizer或OneHotEncoder函数进行处理。怎么写

05-31

from sklearn.preprocessing import OneHotEncoder enc = OneHotEncoder() y_true_reshape = y_true.reshape(-1, 1) y_true_bin = enc.fit_transform(y_true_reshape).toarray() ``` 其中，y_true_reshape是将多...