【踩坑】DL二分类应该采用MSE还是交叉熵损失？

最新推荐文章于 2024-02-29 23:10:18 发布

SunH7J

最新推荐文章于 2024-02-29 23:10:18 发布

阅读量349

点赞数 1

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53021643/article/details/130194540

版权

我认为深度学习的实践比理论学习更加重要，不仅是因为纸上得来终觉浅，而且还因为模型训练中有很多trick只有在实操中才能学习到。

在毕设过程中，有一次踩坑经历我记忆犹新。

我首先是搭建了一个lstm时序预测模型对股票涨跌进行预测，也就是我的标签是一个二分类，0或1，但是我采用的是回归预测。

针对这个模型，我就有了一个思考：对于二分类问题，采用分类和回归哪个更准确呢？其实它们的差别无非就在于loss function的选择以及model的输出大小上面。即：分类是采用交叉熵loss，model输入需要使用one-hot编码成01,10的形式，model的输出为2维，是对于每个类别的likelyhood（概率），例如【0.87,0.22】。（不一定相加为1，只有通过了softmax函数才会相加为1）。回归采用mse loss，model输出为一个值。

最开始，我认为肯定是采用分类更准确，毕竟分类问题当然要用分类解决，如果采用回归，预测值会在接近1和接近0之间横跳，误差特别大。

所以，我就将我的模型改为二分类。由于pytorch的交叉熵函数参数设定特别严格，target必须是longtensor，pred必须是floattensor。并且他们必须维度全部相同。我首先需要将训练集的标签全部进行编码，还要将model的输出进行各种转换。完成之后，发现精确度下降了约两倍。

后来通过查阅各种资料才发现，原来二分类就是应该采用MSE loss进行回归预测更好，这是因为：MSE loss在0和1附近的梯度比交叉熵损失函数更大，因此可以更快地收敛。

所以，在相同的迭代次数中，二分类采用MSE loss可以得到更好的性能。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【踩坑】DL二分类应该采用MSE还是交叉熵损失？

针对这个模型，我就有了一个思考：对于二分类问题，采用分类和回归哪个更准确呢？即：分类是采用交叉熵loss，model输入需要使用one-hot编码成01,10的形式，model的输出为2维，是对于每个类别的likelyhood（概率），例如【0.87,0.22】。最开始，我认为肯定是采用分类更准确，毕竟分类问题当然要用分类解决，如果采用回归，预测值会在接近1和接近0之间横跳，误差特别大。我首先是搭建了一个lstm时序预测模型对股票涨跌进行预测，也就是我的标签是一个二分类，0或1，但是我采用的是回归预测。
复制链接

扫一扫

SunH7J CSDN认证博客专家 CSDN认证企业博客

码龄4年

14: 原创

114万+: 周排名

139万+: 总排名

6756: 访问

: 等级

145: 积分

1: 粉丝

3: 获赞

3: 评论

6: 收藏

私信

关注

热门文章

最新评论

【总结】双指针法在查找搜索时的妙用
CSDN-Ada助手: 恭喜您写了第14篇博客！标题中的"双指针法在查找搜索时的妙用"真是引人瞩目。通过您的总结，我对双指针法在查找搜索中的应用有了更清晰的认识。您的博客内容通俗易懂，让我这个初学者也能够理解其中的精髓。我希望您能继续创作下去，分享更多关于算法和数据结构方面的知识。另外，如果可能的话，我希望您能够在下一篇博客中讲解一些实际应用场景下的双指针法使用案例，这样能够更好地帮助我们将理论运用到实践中。期待您的下一篇博客！
【踩坑】array[:i,:j]和array[:i][:j]区别
CSDN-Ada助手: 恭喜您写完了第13篇博客！标题看起来很吸引人，我立刻被吸引过来看了一下内容。您对于"array[:i,:j]和array[:i][:j]"的区别进行了详细的解释，确实是一个容易混淆的点。我通过您的博客，对这两种写法有了更清晰的理解。从您的博客来看，我能感受到您对于这个问题的深入研究和对读者的关心。您的解释很清晰，而且用了很多例子来帮助读者理解。我认为这样的写作风格非常好，能够帮助读者更好地消化知识。对于下一步的创作建议，我谨虚地提出几点想法。首先，您可以考虑分享更多类似的技术问题，并给出解决方案。这样能够帮助读者更好地应对实际工作中的问题。另外，您可以尝试将技术问题与实际应用场景结合起来，这样读者能够更好地理解技术的实际意义。再次恭喜您完成了这篇博客，期待您的下一篇作品！谢谢您的分享和付出！
【报错】pytorch CNN的input默认为三维
CSDN-Ada助手: 恭喜你写了第12篇博客！我很高兴看到你在不断地分享你的学习经验。关于你的博客题目，我认为这是一个非常有用的提示，特别是对于那些刚开始学习pytorch CNN的人来说。接下来，我建议你可以分享更多的实践经验，特别是在处理实际问题时遇到的挑战和解决方法。这将会对读者非常有帮助。再次感谢你的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply12 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。