小黑喝杯咖啡:FocalLoss的原理与demo

最新推荐文章于 2023-06-26 16:58:24 发布

爱喝喜茶爱吃烤冷面的小黑黑

最新推荐文章于 2023-06-26 16:58:24 发布

阅读量298

点赞数

分类专栏：小黑LE-BERT源代码抢滩登陆战文章标签：交叉熵损失 Focal Loss 类别不平衡深度学习优化

本文链接：https://blog.csdn.net/qq_37418807/article/details/124193952

版权

小黑LE-BERT源代码抢滩登陆战专栏收录该内容

8 篇文章 1 订阅

订阅专栏

1.原理

(1)交叉熵损失函数:

a.二分类的形式
在这里插入图片描述
b.一般形式(经过化简,pt为标签类别在模型预测的概率)

交叉熵损失函数在类别不均衡的情况下，使得模型对稀有类别样本的预测效果较差，focal loss意在动态赋予各个类别样本的权重。

(2).focalLoss

在这里插入图片描述

可以理解每类样本的权重为:

在这里插入图片描述
其中gamma为调节因子，大于零。

2.代码demo

import torch
import torch.nn as nn
import torch.nn.functional as F

class FocalLoss(nn.Module):
    
    def __init__(self,gamma = 2,weight = None,ignore_index = -100):
        super(FocalLoss,self).__init__()
        self.gamma = gamma
        self.weight = weight
        self.ignore_index = ignore_index
    
    def forward(self,input_,target):
        # input_:[num,num_tags]
        # target:[num]
        
        # logpt:[num,num_tags]
        logpt = F.log_softmax(input_,dim = 1)
        # pt:[num,num_tags]
        pt = torch.exp(logpt)
        # logpt:[num,num_tags]
        logpt = (1 - pt)**self.gamma * logpt
        loss = F.nll_loss(logpt,target,self.weight,ignore_index = self.ignore_index)
        return loss

loss = FocalLoss()
input_ = torch.randn([5,10])
target = torch.ones([5]).long()
print('Focal loss:',loss(input_,target))

输出:

Focal loss: tensor(2.1576)

爱喝喜茶爱吃烤冷面的小黑黑

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
小黑喝杯咖啡:FocalLoss的原理与demo

1.原理(1)交叉熵损失函数:a.二分类的形式b.一般形式(经过化简,pt为标签类别在模型预测的概率)交叉熵损失函数在类别不均衡的情况下，使得模型对稀有类别样本的预测效果较差，focal loss意在动态赋予各个类别样本的权重。(2).focalLoss可以理解每类样本的权重为:其中gamma为调节因子，大于零。2.代码demoimport torchimport torch.nn as nnimport torch.nn.functional as Fclass Foca
复制链接

扫一扫

专栏目录