八股文——机器学习基础损失函数

wangziling123456

已于 2024-06-11 21:08:40 修改

阅读量477

点赞数 10

文章标签：机器学习人工智能深度学习

于 2024-03-21 22:11:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangziling123456/article/details/136919743

版权

一、常见的代价函数

1、二次代价函数

J=1/2nΣ||a(x)-y(x)||^2

对于一个样本而言，J=(y-a)/2

激活函数的梯度越大，权值w和b大小调整的越快，训练收敛的越快

假使激活函数是sigmoid函数，当使用二次代价函数时，很可能会出现梯度消失，使用sigmoid函数在饱和区即x过大或者过小时，梯度是接近于0

2.交叉熵代价函数

J=-1/nΣ[yln(a)+(1-y)ln(1-a)]

更适合搭配sigmoid激活函数

二、常见的损失函数

1.用于回归

绝对值损失函数和平方损失函数

绝对值损失函数MAE

平方损失函数MSE

MSE比MAE可以更快的收敛，当使用梯度下降算法时，MSE梯度下降是变化的，MAE梯度损失是均匀不变的，梯度不发生改变不利于模型的训练（调节学习率）。

MAE鲁棒性更好，MAE与绝对损失之间是线性关系，MSE与误差是平方关系，当误差比较大时，MSE的误差更大。当数据中出现了一个非常大的离群点，MSE会产生非常大的损失，对模型的训练产生非常大的影响

2.用于分类

0-1损失函数

对数损失函数

指数损失函数

交叉熵损失函数

三、代价函数、损失函数、目标函数

目标函数：需要优化的函数=代价函数+结构风险（cost function+正则化）

损失函数是定义在单个样本上的，代价函数是定义在整个训练集上的，是所有样本误差的总和的平均

为什么回归问题中使用平方损失函数而不用交叉熵损失函数？

因为交叉熵损失函数在回归问题上只看到了正确的类别，而没有看到错误的另外。MSE是计算了全部的损失

为什么分类问题中使用交叉熵损失函数而不用平方损失函数

使用平方损失函数时，梯度下降与激活函数的导数成正比，sigmoid激活函数有饱和区，在饱和区内激活函数的导数趋近于0，会容易产生梯度消失的问题

使用交叉熵损失函数时，梯度下降与（激活函数-真实值）成正比，差值较大，更新就快，差值较小，更新就慢

wangziling123456

关注

10
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
八股文——机器学习基础损失函数

对于一个样本而言，J=(y-a)/2激活函数的梯度越大，权值w和b大小调整的越快，训练收敛的越快假使激活函数是sigmoid函数，当使用二次代价函数时，很可能会出现梯度消失，使用sigmoid函数在饱和区即x过大或者过小时，梯度是接近于0。
复制链接

扫一扫

wangziling123456 CSDN认证博客专家 CSDN认证企业博客

码龄2年

22: 原创

117万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

407: 积分

162: 粉丝

187: 获赞

9: 评论

186: 收藏

私信

关注

热门文章

最新评论

一文读懂RAG
CSDN-Ada助手: 恭喜您写出了如此精彩的一篇博客！通过您的文章，我对RAG有了更深入的了解。希望您能继续保持创作的热情，分享更多有价值的内容。或许下一步可以深入探讨RAG的应用场景或者与其他技术的结合，让读者们有更多的收获。期待您的下一篇作品！祝您创作愉快！
AI Agent论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
AI Agent论文阅读
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618538741。
八股文——机器学习基础参数初始化
CSDN-Ada助手: 恭喜作者撰写了第5篇博客，探讨了关于机器学习基础参数初始化的主题。不断学习和分享知识是非常值得赞赏的，希望作者能继续保持创作的热情和努力。接下来，建议可以深入研究不同的参数初始化方法，以及它们在实际应用中的效果和优劣势，这样可以为读者提供更加全面和深入的内容。希望作者在未来的创作中能够继续努力，不断提升自己的写作水平和专业知识。期待看到更多精彩的文章！愿你前程似锦，写作越来越好！
八股文——机器学习基础Dropout
CSDN-Ada助手: 恭喜您写下了第6篇博客！标题中提到了“八股文——机器学习基础Dropout”，内容一定十分精彩！希望您能继续保持写作的热情和创造力，不断探索更多有趣的主题。或许下一篇博客可以深入探讨一些实践经验或者案例分析，让读者更加深入地了解机器学习领域的知识。期待您的下一篇作品！谢谢您的分享！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。