各种 loss 学习笔记

这篇博客介绍了几种深度学习中的损失函数,包括Large Margin Cosine Loss(LMCL)、Additive Angular Margin Loss(ArcFace)和Adaptive Cosine-based Loss(AdaCos)。LMCL通过转换到角度空间增强分类能力,ArcFace和AdaCos在添加余弦余量上有不同策略。AdaCos则引入动态自适应尺度参数,避免手动调参。
摘要由CSDN通过智能技术生成


之间已经介绍过几个比较经典的 loss function 啦,这里再补充三个最近看到的 loss function。

Large Margin Cosine Loss

这个 loss function 的提出,基本思想是将损失函数的计算从距离空间转换到角度空间。
欧几里得空间 (距离空间) → \rightarrow 余弦空间 (角度空间)

首先复习一下 softmax loss:
L s = 1 N ∑ i = 1 N − log ⁡ p i = 1 N ∑ i = 1 N − log ⁡ e f y i ∑ j = 1 C e f j L_{s}=\frac{1}{N} \sum_{i=1}^{N}-\log p_{i}=\frac{1}{N} \sum_{i=1}^{N}-\log \frac{e^{f_{y_{i}}}}{\sum_{j=1}^{C} e^{f_{j}}} Ls=N1i=1Nlogpi=N1i=1Nlogj=1Cefjefyi

  • N:训练样本数;
  • p i p_{i} pi x i x_{i} xi 被正确分类的后验概率;
  • C C C 是类别数目;
  • f j f_{j} fj 表示全连接层的激活公式,有 f j = W j T x = ∥ W j ∥ ∥ x ∥ cos ⁡ θ j f_{j}=W_{j}^{T} x=\left\|W_{j}\right\|\|x\| \cos \theta_{j} fj=WjTx=Wjxcosθj 。(令偏重 B j = 0 B_{j}=0 Bj=0

为了消除径向方向的影响,令 ∥ W j ∥ = 1 \left\|W_{j}\right\|=1 Wj=1 ∥ x ∥ = s \|x\|=s x=s

为了充分提高损失函数的分类能力,引入余弦余量 m m m,得到 Large Margin Cosine Loss (LMCL) 定义如下:
L l m c = 1 N ∑ i − log ⁡ e s ( cos ⁡ ( θ y i , i ) − m ) e s ( cos ⁡ ( θ y i , i ) − m ) + ∑ j ≠ y i e s cos ⁡ ( θ j , i ) L_{l m c}=\frac{1}{N} \sum_{i}-\log \frac{e^{s\left(\cos \left(\theta_{y_{i}, i}\right)-m\right)}}{e^{s\left(\cos \left(\theta_{y_{i}, i}\right)-m\right)}+\sum_{j \neq y_{i}} e^{s \cos \left(\theta_{j, i}\right)}} Llmc=N1iloges(cos(θyi,i)m)+j̸=yiescos(θj,i)es(cos(θyi,i)m)
其中,
W = W ∗ ∥ W ∗ ∥ x = x ∗ ∥ x ∗ ∥ cos ⁡ ( θ j , i ) = W j T x i \begin{aligned} W &=\frac{W^{*}}{\left\|W^{*}\right\|} \\ x &=\frac{x^{*}}{\left\|x^{*}\right\|} \\ \cos \left(\theta_{j}, i\right) &=W_{j}^{T} x_{i} \end{aligned} Wxcos(θj,i)

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值