线性回归算法梳理1

最新推荐文章于 2019-03-31 16:19:11 发布

Tinkle_Sunshine

最新推荐文章于 2019-03-31 16:19:11 发布

阅读量194

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44450461/article/details/88904900

版权

本文介绍了有监督学习与无监督学习的基本概念，重点讲述了线性回归的原理、损失函数、优化方法如梯度下降法，以及评估指标如皮尔逊相关系数和均方根误差。此外，还提到了过拟合和欠拟合的解决方案，并简单介绍了sklearn线性回归模型的参数设置。

摘要由CSDN通过智能技术生成

机器学习的一些概念
有监督学习、无监督学习
根据数据是否拥有标记信息，学习任务可以分为有监督学习和无监督学习。

有监督学习：用已知某种或某些特性的样本作为训练集，以建立一个数学模型，再用已建立的模型来预测未知样本，此种方法称为有监督学习。
分类（离散）和回归（连续）属有监督学习；

无监督学习：根据类别样本（没有被标记）的训练样本解决模型识别中的各种问题。
聚类属无监督学习
泛化能力
学得模型应用于新样本的能力称为泛化能力
训练样本越多，得到关于“分布”D的信息越多，越有可能通过学习获得具有强泛化能力的模型。
过拟合欠拟合
过拟合：因为学习能力太好，把训练样本所包含的不太一般的特点当成所有潜在样本都会具有的一般性质，导致泛化性能下降的情况。
解决方法：①留出法——将数据集分成互斥的训练集和测试集
②交叉验证法——将数据集D分为k个大小相似的互斥子集，然后，每次用k-1个并集作为训练集，余下的那个子集作为测试集，这样，可以得到k组训练集和测试集，从而进行k次的训练和测试，最终返回K个测试结果的均值。
在这里插入图片描述
③ 自助法——在m个数据集中采样组成训练集，数据集\训练集用作测试集的方法。适用数据集较小，难以区分训练集/测试集的情况

欠拟合：因为学习能力太差，

最低0.47元/天解锁文章

Tinkle_Sunshine

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
线性回归算法梳理1

机器学习的一些概念有监督学习、无监督学习根据数据是否拥有标记信息，学习任务可以分为有监督学习和无监督学习。有监督学习：用已知某种或某些特性的样本作为训练集，以建立一个数学模型，再用已建立的模型来预测未知样本，此种方法称为有监督学习。分类（离散）和回归（连续）属有监督学习；无监督学习：根据类别样本（没有被标记）的训练样本解决模型识别中的各种问题。聚类属无监督学习泛化能力学得模型应...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。