数据预处理3:处理分类型特征(1)

最新推荐文章于 2021-10-14 11:36:55 发布

Aksinia

最新推荐文章于 2021-10-14 11:36:55 发布

阅读量157

点赞数

分类专栏：机器学习技法文章标签： python sklearn 机器学习

本文链接：https://blog.csdn.net/weixin_51871375/article/details/120759404

版权

机器学习技法专栏收录该内容

11 篇文章 0 订阅

订阅专栏

在大多数机器学习算法中都是只能处理数值型数据，不能处理文字,尤其是sklearn的实现。
很多标签和特征在数据收集后不是以数字呈现的，付费方式可能包含[“支付宝”，“数字人民币”，“微信”]。
所有大多数情况下我们必须把数据编码

情况1:
对标签

from sklearn.preprocessing import LabelEncoder
y=data.iloc[:,-1]
le =  LabelEncoder()
le = le.fit(y)#导入数据
label = le.transform(y) #transform接口调用结果
le.classes_#属性.classes_查看标签中究竟有多少类别

label #查看获取的结果label
#le.fit_transform(y) #也可以直接fit_transform一步到位
#le.inverse_transform(label) #使用inverse_transform可以逆转

得到一串array([0,2,2,2,0,1,…])

data.iloc[:,-1]=label
data.head()

覆写最后一列
在这里插入图片描述

#也可以一步到位
from sklearn.preprocessing import LabelEncoder
data.iloc[:,-1] = LabelEncoder().fit_transform(data.iloc[:,-1])

情况2:
对特征

from sklearn.preprocessing import OrdinalEncoder
#接口categories_对应LabelEncoder的接口classes_，一模一样的功能
data_ = data.copy()
data_.head()

在这里插入图片描述

OrdinalEncoder().fit(data.iloc[:,1:-1]).categories_
#取每一行，从第2个列开始只不取最后一列。
#categories_ like classes_

在这里插入图片描述

data_.iloc[:,1:-1] = OrdinalEncoder().fit_transform(data_.iloc[:,1:-1])
data_.head()

在这里插入图片描述

Aksinia

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据预处理3:处理分类型特征(1)

在大多数机器学习算法中都是只能处理数值型数据，不能处理文字,尤其是sklearn的实现。很多标签和特征在数据收集后不是以数字呈现的，付费方式可能包含[“支付宝”，“数字人民币”，“微信”]。所有大多数情况下我们必须把数据编码情况1:对标签from sklearn.preprocessing import LabelEncodery=data.iloc[:,-1]le = LabelEncoder()le = le.fit(y)#导入数据label = le.transform(y) .
复制链接

扫一扫

专栏目录