python使用独热编码的两种情况

本文介绍了在数据预处理阶段如何对特征进行独热编码,分别展示了当特征为数字和具体类别时的处理方法。对于数字特征,使用OneHotEncoder进行编码;对于具体类别,通过get_dummies函数直接生成列名,并展示了如何通过map函数进行数据转换。这些方法在机器学习和数据分析中至关重要。
摘要由CSDN通过智能技术生成

特征内容为数字时,采用以下代码

df_Species = df_iris.iloc[:, -1:]   
iris_oh = pd.DataFrame(OneHotEncoder(handle_unknown='ignore').fit(df_Species).transform(df_Species).toarray())
print(iris_oh)

输出结果

数据为具体内容时,可直接采用get_dummies函数,该函数可直接生成列名,更加便捷

data = pd.DataFrame([['green', 'M', 10.1, 'class1'], ['red', 'L', 13.5, 'class2'], ['blue', 'XL', 15.3, 'class1']])
data.columns = ['color', 'size', 'prize', 'class label']
size_d = {"M": 1, "L": 2, "XL": 3}
data["size"] = data["size"].map(size_d)   #使用map即可取消对应列的独热编码
lable = {"class1": 1, "class2": 2}
data["class label"] = data["class label"].map(lable)
print(data)
df = pd.get_dummies(data)
print(df.head())

输出结果

如有不足之处,欢迎大佬指正

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值