【pandas】get_dummies将类别特征转为onehot

本文介绍了如何使用pandas的get_dummies函数将DataFrame中的str类型类别特征转换为one-hot编码,展示了实例操作并讨论了预测时的数据处理方式。重点在于get_dummies的用法和注意事项。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天又学了一招,pandas将str类型类别特征,转为one-hot。注意一定要是str类型,int类型报错。

pandas.get_dummies 的用法_数据分析-CSDN博客

get_dummies 是利用pandas实现one hot encode的方式。详细参数请查看官方文档
官方文档在这里

pandas.get_dummies(data, 
prefix=None, 
prefix_sep='_', 
dummy_na=False, 
columns=None, 
sparse=False, 
drop_first=False)[source]

举例

import pandas as pd
df = pd.DataFrame([  
            ['green' , 'A'],   
            ['red'   , 'B'],   
            ['blue'  , 'A']])  

df.columns = ['color',  'class'] 
pd.get_dummies(df) 

get_dummies 前:

get_dummies 后:每个类别自成一列。

 上述执行完以后再打印df 出来的还是get_dummies 前的图,因为你没有写

df = pd.get_dummies(df)


可对指定列进行get_dummies,指定color列one-hot

pd.get_dummies(df.color)

 

将指定列进行get_dummies 后合并到元数据中

df = df.join(pd.get_dummies(df.color))

 

 蓝色的,原color特征列要删掉。 

不知道如果预测的时候,怎么搞??需要第一次将one-hot数据保存下来,然后redis里输入color直接调用one-hot结果???

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值