LR实例：波士顿房价预测2

最新推荐文章于 2024-06-29 14:53:50 发布

进击の糖炒栗子

最新推荐文章于 2024-06-29 14:53:50 发布

阅读量949

点赞数

分类专栏：读书笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/snowyzhe/article/details/97391195

版权

这篇博客介绍了如何通过sklearn的train_test_split函数进行训练集和测试集划分，利用均方误差和决定系数评估线性回归模型，并探讨了特征相关性对模型的影响。此外，还比较了线性回归、决策树和随机森林的预测误差和评分差异。

摘要由CSDN通过智能技术生成

上次做了最简单的一个LR实例，然后遗留了几个可以改进的问题：

1.训练集和测试集的划分

2.模型的评估和调整

3.特征的筛选

针对这些问题，分别查找了一些解决方法：

1.sklearn的train_test_split函数

train_test_split函数用于将矩阵随机划分为训练子集和测试子集，并返回划分好的训练集测试集样本和训练集测试集标签。

格式：

X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)

参数解释：

train_data：被划分的样本特征集

train_target：被划分的样本标签

test_size：如果是浮点数，在0-1之间，表示样本占比；如果是整数的话就是样本的数量

random_state：是随机数的种子。

随机数种子：其实就是该组随机数的编号&

最低0.47元/天解锁文章

进击の糖炒栗子

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。