100 Days Of ML Code:Day3-Multiple Linear Regression

这篇博客是100天机器学习挑战的第3天内容,主要讨论了多元线性回归。作者介绍了数据预处理的重要性,特别是独热编码的概念和作用,以避免模型对类型数据的错误处理。在预处理阶段,使用OneHotEncoder进行了独热编码。接着,文章提到了训练和预测步骤,但未详细展开。最后,提供了完整的代码链接。
摘要由CSDN通过智能技术生成

100天机器学习挑战汇总文章链接在这儿

目录

Step 1:数据预处理

Step 2:训练

Step 3:预测

最后:全部代码


 

上图中介绍了线性回归中涉及到的重要的概念,如多重共线性、哑变量等,便于阅读我做了批注。

具体的内容可以复习我的这篇文章

Day3的coding与Day2的十分类似,可以作为参考。

Step 1:数据预处理

这里相比于Day2来说,多用到了一个OneHotEncoder函数:

独热编码(One-Hot Encoding):

在数据处理和特征工程中,经常会遇到类型数据,如性别分为[男,女](暂不考虑其他。。。。),手机运营商分为[移动,联通,电信]等,我们通常将其转为数值带入模型,如[0,1], [-1,0,1]等,但模型往往默认为连续型数值进行处理,这样其实是违背我

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值