pandas处理分类变量的方法

最新推荐文章于 2024-05-14 18:38:18 发布

Ethan Chen

最新推荐文章于 2024-05-14 18:38:18 发布

阅读量3.8k

点赞数 1

分类专栏： python入门总结 pandas 文章标签： pandas python 分类变量处理机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cpc784221489/article/details/105708751

版权

在做预测分类的任务中，如果出现了分类变量，要对其进行一些处理，例如

sex 【男，女】
城市【北京，上海，广州，深圳】
颜色【red, blue】

在对这些分类变量处理的时候要注意以下两点原则

离散特征的取值之间没有大小的意义，比如color：[red,blue],那么就使用one-hot编码
离散特征的取值有大小的意义，比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

遵循这两点对于机器学习的分类任务有很大的关系

df = pd.DataFrame([
            ['green', 'M' , '一等座'], 
            ['red', 'L', '二等座'], 
            ['blue', 'XL', '三等座'

最低0.47元/天解锁文章

关注

1
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
pandas处理分类变量的方法

在做预测分类的任务中，如果出现了分类变量，要对其进行一些处理，例如sex 【男，女】城市【北京，上海，广州，深圳】颜色【red, blue】在对这些分类变量处理的时候要注意以下两点原则离散特征的取值之间没有大小的意义，比如color：[red,blue],那么就使用one-hot编码离散特征的取值有大小的意义，比如size:[X,XL,XXL],那么就使用数值的映射{X:1,...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。