day1.线性回归算法梳理

最新推荐文章于 2020-08-23 23:33:01 发布

文艺亨亨�

最新推荐文章于 2020-08-23 23:33:01 发布

阅读量215

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/uknowliz/article/details/88068183

版权

这篇博客梳理了线性回归算法的基础知识，包括有监督学习与无监督学习的概念，泛化能力、过拟合和欠拟合的定义及解决办法，以及交叉验证的重要性。接着介绍了线性回归的基本原理、损失函数、优化方法如梯度下降法、牛顿法和拟牛顿法，以及评估指标如残差估计、均方误差和决定系数。最后提到了sklearn库中线性回归模型的相关参数及其作用。

摘要由CSDN通过智能技术生成

打卡：day1.线性回归算法梳理

机器学习的一些概念
有监督、无监督、泛化能力、过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证
有监督、无监督：
有监督学习：针对有很多特征的数据集，进行有标签或者目标的学习为有监督学习；
无监督学习：针对有很多特征的数据集，试图显式或者隐式地学习出概率分布为无监督学习。
传统上，将回归、分类或者结构化输出问题称为监督学习，将支持其他任务的密度估计称为无监督学习。

泛化能力、过拟合或欠拟合(方差和偏差以及各自解决办法)：
模型训练中，将训练样本自身的一些特点当成了所有潜在样本都具备的一般性质，即过拟合。与过拟合相对应的是欠拟合，指对训练样本的一般性质尚未学好。
泛化能力即指在测试集上的适用能力。
泛化误差由偏差、方差和噪声组成。偏差度量了学习算法的期望预测与真实结果的偏离程度，即刻画了学习算法本身的拟合能力，方差度量了同样大小的训练集的变动所导致的学习性能的变化，即刻画了数据扰动所造成的影响。噪声则表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界，即刻画了学习问题本身的难度。所以泛化能力是由学习算法的能力、数据的充分性以及学习任务本身的难度共同决定的。为了避免欠拟合，则要使偏差较小，即充分拟合数据；为了避免过拟合，则要使方差较小。

交叉验证：
交叉验证：将数据集划分为k个不重合的子集，每次用k-1个子集的并集作为训练集，余下的为测试集，即可获得k组训练/测试集，从而可进行k次训练和测试，最终返回的是这k个测试结果的均值。

线性回归的原理
线性回归在假设特证满足线性关系，根据

最低0.47元/天解锁文章

文艺亨亨�

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。