python-pandas/sklearn中进行的编码方法

python-pandas/sklearn中进行的编码方法

1、进行将字符串一个或多个特征属性下的多个类别进行转化为1,2,3 …

1)、进行导入的库

from sklearn.preprocessing import LabelEncoder

2)、举例说明

data[object_data]=data[object_data].apply(LabelEncoder().fit_transform)

2、使用字符串独热进行转换

1)、方法一:使用pandas中进行独热编码

(1)、进行导入的库

 import pandas as pd

(2)、举例说明

	pd.get_dummies(df['key'],prefix='key')
	参数一:需要转化的数据
	参数二:进行独热后加的前缀
2)、方法二:使用sklearn的库进行编码()

(1)、对类别进行编码

    from sklearn.preprocessing import LabelEncoder
    class_le = LabelEncoder()
    y = class_le.fit_transform(类别(标签).values)

(2)、对离散特征进行独热编码

	X = df[['需要转换的特征属性']].values
	le = LabelEncoder()
	'特征属性的value' = le.fit_transform('特征属性的value')
	from sklearn.preprocessing import OneHotEncoder
	oh = OneHotEncoder(categorical_features=[0])
	oh.fit_transform(X).toarray()    # 从稀疏矩阵转换为一般矩阵
  • 不加.toarray()时结果的显示:
    在这里插入图片描述

例题:


在这里插入图片描述

OneHotEncoder()适用于多个集合的情况,如:训练集和测试集;get_dummies只适用于一个数据集情况
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值