机器学习中线性回归问题以及算法的解决办法提出

最新推荐文章于 2024-08-13 01:54:14 发布

July_sun

最新推荐文章于 2024-08-13 01:54:14 发布

阅读量6.4k

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/July_sun/article/details/53148164

版权

回归分析通过最小二乘法寻找变量间的统计关系。机器学习的泛化误差由数据、算法和学习难度共同决定。线性回归假设包括随机误差的独立性和同方差性，但实际中常遇到异方差性、自相关性和多重共线性问题。解决方法包括PCA和Lasso回归。更多更好的数据是提升预测准确性的关键。

摘要由CSDN通过智能技术生成

回归分析研究的是客观事物变量间的统计关系，通过在对客观事物大量实验和观测的基础上，找到隐藏在不确定现象中的规律性的统计方法。这一方法从高斯提出的最小二乘法算起已经有200年的历史，一直在被各种学科广泛的应用中。

机器学习的回归思想也是通过丢给机器学习和观察数据来找到杂乱数据间隐藏的规律，通过建模和算法使得规律得到的结果不仅与真实的结果越逼近越好，而且在新的数据上也有很好的预测准确性，也就是好的泛化能力。首先从误差理论说起：

一、机器学习中的误差理论

模型和学习算法的泛化性能好坏的评价标准是泛化误差（泛化错误率），首先对范化误差进行计算和拆解：

几个参量描述如下：

测试样本：x

x在数据集上的标记：yD

x的真实标记：y

训练集D上的模型f在x上的预测输出：f（x；D）

学习算法的期望预测：ED[f（x；D）]

样本数相同的不同训练集产生的方差：var（x）= ED[(f（x；D）-ED[f（x；D）])^2]，表征数据扰动造成的影响

噪声：epsilon=ED[(yD-Y）^2]，表征学习本身的难度

期望输出和真实标记的差别，即方差：Bias^2（x）=(ED[f（x；D）]-y)^2，

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。