focalloss是如何优化的

最新推荐文章于 2023-07-15 11:04:31 发布

ixyking

最新推荐文章于 2023-07-15 11:04:31 发布

阅读量555

点赞数 1

文章标签：机器学习 python 深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41626518/article/details/115381690

版权

focalloss通过调整难分类样本的权重，解决了在样本不平衡情况下，模型过于关注易分类样本的问题。它通过静态的α和动态的γ参数，动态调整错误分类样本的权重，以改善模型的优化方向，提高分类困难样本的影响力。

摘要由CSDN通过智能技术生成

loss的优化原理

我们都知道反向传播是计算梯度调整权重参数，使得loss不断变小的一个过程
梯度的计算是通过loss计算得来。

一个batch里的样本，计算每个样本的梯度求和平均，作为最后模型的调整梯度。问题就在这里，平均，那就是把每个样本需要的梯度直接取均值，如果样本中某个分类的样本点很多，那么模型的调整方向将大幅度靠近更易区分这类样本的模型优化方向。穷的更穷，富得更富，几个batch下来，好分类的基本没问题了，难分类的也就更难区分了。

所以，loss优化根本目的就是要改变模型的优化方向，不能一直向易分类的方向走，要向难分类需要的优化方向靠近一点。那这怎么办呢？权重！
求模型优化梯度本身就是各个样本梯度求均值，我们将难分类样本的梯度权重加大，易分类样本的权重降低，最终计算所得的梯度自然而然就靠近难分类样本了。
那么权重该如何设置呢？（权重的添加基于交叉熵损失函数）

focalloss

focalloss的主要工作就是利用α和γ两个静态和动态的调整了难分类样本的权重。
静态就是alpha直接与原loss相乘，这个值是个固定值。
动态就是，根据模型的训练结果，增大模型预测错误的样本loss权重，降低模型预测正确的样本loss权重，动态调整每次的梯度计算，以达到优化效果。
下面就是focalloss 的函数：

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。