角度间隔损失函数

银晗

已于 2023-05-23 21:07:35 修改

阅读量786

点赞数 3

分类专栏：医疗图像文章标签：机器学习人工智能深度学习

于 2023-05-08 19:46:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/RandyHan/article/details/130560501

版权

医疗图像专栏收录该内容

18 篇文章 1 订阅

订阅专栏

文章探讨了SoftMax损失函数及其优化形式，如Large-MarginSoftmax、SphereFace和ArcFace。这些方法通过关注角度而不是欧几里得距离来改善分类性能，其中SphereFace和CosFace着重于固定间隔策略。ArcFace是角度margin的一种实现，旨在增加不同类别之间的区分度。

摘要由CSDN通过智能技术生成

度量损失：
在这里插入图片描述

在这里插入图片描述

SoftMax

在这里插入图片描述

根据softmax的函数公式进行变换，然后归一化到概率
解决上溢和下溢出问题（softmax函数自身性质问题），取一个log
用一个a做恒等变换，解决这个问题，带入softmax函数，值不变
决策边界是没有变的

转换成角度

用向量的性质， $*cos(\theta)$

解决的核心问题：用欧几里得距离度量，不同类之间的距离可能小于同类之间的距离，用角度来度量可以缓解优化这个问题

Large-Margin Softmax Loss

在这里插入图片描述

对cos角度进行改进，使得类别标签之间的角度更小（误差更小）

Modified Softmax

在这里插入图片描述

把原来的softmax的权重赋值为1和偏差赋值为0
显然，规约到球面是一个好的选择

SphereFace Angular Softmax

在这里插入图片描述

SphereFace的损失函数：
在这里插入图片描述

NormFace

background

在这里插入图片描述

在特征提取中都没有归一化（训练过程中），但是在测试中都使用了归一化

在这里插入图片描述

在这里插入图片描述

feature的scale（缩放尺度）越大， $P_i(sf)$ 越大，softmax loss就越小

为什么会是特征会呈辐射状分布？

在这里插入图片描述

Softmax 交叉熵损失函数总是会鼓励已经被分类正确的特征得到更大的幅度。

在迭代过程中，特征的幅度会被越拉越大，这就是为什么 Softmax 交叉熵损失函数训练出的特征总是呈现出辐射状分布的原因

softmax前的内积层不可以添加偏置项

原理

在这里插入图片描述

完全专注于角度，在放缩的时候加了一个 $\alpha$

在这里插入图片描述

在这里插入图片描述

CosFace /AM-softmax

该方法间隔固定，不依赖于theta， sphereFace的间隔依赖于theta

在这里插入图片描述

AM-softmax

在这里插入图片描述

ArcFace

在这里插入图片描述

总结一下角度的损失函数

在这里插入图片描述

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

银晗 CSDN认证博客专家 CSDN认证企业博客

码龄4年

127: 原创

7964: 周排名

5万+: 总排名

19万+: 访问

: 等级

2223: 积分

1万+: 粉丝

747: 获赞

80: 评论

1603: 收藏

私信

关注

热门文章

分类专栏

教程操作 5篇
大数据 16篇
深度学习基础 11篇
算法 7篇
机器学习 6篇
GNN 1篇
医疗图像 18篇
Python 8篇
计算机基础 4篇
英语 1篇
Go 2篇
数据结构 2篇

最新评论

雅思资料汇总
大大聂: 非常全面的总结！
LightGBM
gfjy10: 您好，咨询个问题，看一些关于这个lgb算法的介绍，有个最基本的问题，一直没找到答案：lgb的一个优秀特点是：不用把特征列转换成one-hot编码，问题是，如果特征是中文文本，是否需要把中文转换成数值，因为如果不转换成数值，这步model = lgb.train(params, lgb_train, num_boost_round=100, valid_sets=[lgb_eval])，会提示错误：alueError: pandas dtypes must be int, float or bool.Fields with bad pandas dtypes: state: object.如果必须把文本特征转换成数值，应该用什么方法呢
数据并行 - DP/DDP/ZeRO
m0_71534750: 看了几个，你是写的最清楚的
FP tree算法详解附代码及挖掘案例
2401_85283291: 大彻大悟
InterLM代码解析
shixf626: github上没有找到源码工程哇

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。