onehot在python(sklearn)中的使用方法，示例，代码实现

最新推荐文章于 2024-06-26 11:35:37 发布

李莹斌XJTU

最新推荐文章于 2024-06-26 11:35:37 发布

阅读量2k

点赞数

分类专栏： python onehot sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30545831/article/details/104998994

版权

本文探讨了在使用sklearn进行数据分析时遇到的字符串类型转换问题，介绍了onehot编码的原因和方法。通过示例代码展示了如何对数据进行onehot编码以适应sklearn的数值型数据需求，同时讨论了旧版与新版onehotencoder的区别，指出新版无法选择特定列进行编码的问题，并邀请读者分享更优解决方案。

摘要由CSDN通过智能技术生成

首先强调一下，本篇博客是我实验得出来的结论，要是错了，可以在评论区指正，嘻嘻

接下来我会介绍以下三个内容

为什么要用onehot
怎么用

为什么要用onehot:

假设你有一个这样的数据集，格式是csv或者arff格式：

体重	身高	...	class
胖	1 5 0	...	不好看
瘦	1 6 0	...	还可以
有点胖	1 8 0	...	帅
有点瘦	1 5 0	...	还可以

你现在需要对这个数据构建一个分类器，挖掘一些有用的信息，此时你想到了sklearn(真是个错误的决定)，你会发现如果你把这个数据集直接当成数据矩阵numpy,输入sklearn中的分类器中，编译器会提示你，类型错误，无法把string(或者btype)类型转成float....

经过我查阅多方资料，我才明白，原来sklearn中的数据默认得是全数值类型。一个非常好

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。