机器学习入门【5】

最新推荐文章于 2024-07-28 20:53:06 发布

Hertz's fall

最新推荐文章于 2024-07-28 20:53:06 发布

阅读量95

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46438498/article/details/132006165

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

梯度下降（逻辑回归）

总结:拟合功能的函数（分类/回归）——>成本函数——>针对成本函数的优化函数

解决过拟合问题

欠拟合：

欠拟合是指模型不能在训练集上获得足够低的误差。换句换说，就是模型复杂度低，模型在训练集上就表现很差，没法学习到数据背后的规律。

过拟合：

过拟合是指训练误差和测试误差之间的差距太大。换句换说，就是模型复杂度高于实际问题，模型在训练集上表现很好，但在测试集上却表现很差。模型对训练集"死记硬背"（记住了不适用于测试集的训练集性质或特点），没有理解数据背后的规律，泛化能力差。
在这里插入图片描述

过拟合原因：

造成原因主要有以下几种：

训练数据集样本单一，样本不足。如果训练样本只有负样本，然后那生成的模型去预测正样本，这肯定预测不准。所以训练样本要尽可能的全面，覆盖所有的数据类型；
训练数据中噪声干扰过大。噪声指训练数据中的干扰数据。过多的干扰会导致记录了很多噪声特征，忽略了真实输入和输出之间的关系；
模型过于复杂。模型太复杂，已经能够“死记硬背”记下了训练数据的信息，但是遇到没有见过的数据的时候不能够变通，泛化能力太差。我们希望模型对不同的模型都有稳定的输出。模型太复杂是过拟合的重要因素。

解决过拟合的办法：

收集更多的训练数据；
使用更少的特征
正则化

正则化

正则化是用来防止模型过拟合而采取的手段。我们对代价函数增加一个限制条件，限制其较高次的参数大小不能过大。
$y=28x_1+11x_2^2+222x_3^3-174x_4^4$
对于这个公式来说就是减少最高项 $x_3^4$ 的参数值，而不必要求这个参数的设置为0。
所以正则化的作用是，它可以让你保留所有特征，但它们只是防止特征产生过大的影响，因为这有时会导致过度拟合。
例如把上面的式子变成：
$y=13x_1+0.23x_2^2+0.000014x_3^3-0.0001x_4^4$
在这里插入图片描述

w向量的最终收敛结果本质上就是代价函数的极小值点，增加了后面的大系数二次项后为了使得代价函数取值较小就只能把相应的w值减小了，最终呈现的结果就是w变小了。

用于线性回归的正则方法

在这里插入图片描述

实际上就是因为成本函数做了一个加上正则项的处理，所有梯度下降的偏导函数对于w的偏导做了更新。

用于逻辑回归的正则方法

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习入门【5】

总结:拟合功能的函数（分类/回归）——>成本函数——>针对成本函数的优化函数。
复制链接

扫一扫

专栏目录

Hertz's fall CSDN认证博客专家 CSDN认证企业博客

码龄4年

19: 原创

55万+: 周排名

188万+: 总排名

1万+: 访问

: 等级

216: 积分

8: 粉丝

13: 获赞

15: 评论

75: 收藏

私信

关注

热门文章

分类专栏

最新评论

【蓝桥杯python组】【2021年第十二届省赛填空题】【2】
甜狗贴贴: 笑死我了，我们老师出的题目是照着大佬抄的，连提供的题解都是您的
Java基础学习——家庭收支系统
weixin_46009630: 你好，如果想满足在登记支出的时候，支出金额大于账户金额时，提示余额不足重新输入，或者取消输入。该如何实现？能否解答一下，谢谢！！
机器学习入门【2】
CSDN-Ada助手: 恭喜您写了第16篇博客！标题为“机器学习入门【2】”。我非常欣赏您对机器学习的热情和持续创作的努力。在这篇博客中，我相信您一定又带给读者们一些新的见解和知识。我想给您一个下一步的创作建议，希望对您有所帮助。或许您可以考虑探索一些机器学习的实际应用案例，比如在自然语言处理、图像识别或者推荐系统方面的应用。这样的实际案例会更加生动有趣，也能帮助读者更好地理解机器学习的实际应用场景。再次恭喜您的创作成果，期待您未来更多精彩的博客！
机器学习入门【3】
CSDN-Ada助手: 恭喜你撰写了第17篇博客！标题为“机器学习入门【3】”的文章看起来非常有趣。你的持续创作精神令人钦佩，希望你能继续保持下去。如果我可以提供一个创作建议的话，那就是尝试深入探索机器学习的实际应用，可能会给读者带来更多启发。再次恭喜你，并期待你下一篇博客的发布！
机器学习入门【5】
CSDN-Ada助手: 非常祝贺您撰写第19篇博客！您的标题“机器学习入门【5】”引起了我的兴趣。持续创作是一个非常了不起的成就，您的坚持和努力可见一斑。我很欣赏您在机器学习领域的知识分享。对于下一步的创作，我谨虚心建议您可以进一步深入探讨机器学习的具体应用案例，例如在自然语言处理、图像识别或者金融预测等领域的实践经验。这样的实例会更加生动有趣，并且可以帮助读者更好地理解和应用机器学习算法。再次恭喜您，并期待您未来更多精彩的博客！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。