caffe层解读系列——hinge_loss

最新推荐文章于 2024-01-04 11:31:13 发布

原创

最新推荐文章于 2024-01-04 11:31:13 发布 · 5.4k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#caffe

————— Hinge Loss 定义 —————

Hinge Loss 主要针对要求”maximum-margin”的分类问题，因此尤其适用于SVM分类。

Hinge Loss的定义如下：

\(l(y) = max(0,1-t\cdot y)\)

其中， \(t=\pm1\) , 需要注意的是 \(y\) 并不是分类的label，而只是决策函数的输出。例如在线性SVM中， \(y=wx+b\), \(x\) 是待分类点， \(w\) 和 \(b\) 构成分类超平面。

从定义可以很容易看出，当 \(t\) 和 \(y\) 符号一致(表示 \(y\) 分类正确) 且 \(\Vert y\Vert \ge 1\) 时Hinge Loss \(l(y)=0\); 当符号不一致时，\(l(y)=0\) 随 \(y\) 线性增加。

———— caffe中如何定义Hinge Loss ————

caffe中定义与上面的介绍有些相反的地方，下面具体介绍caffe中具体是怎样实现的。

caffe提供了 L1 和 L2 两种Hinge Loss,即

\(l(y) = \Vert H\Vert_1 \) 和 \(l(y) = \Vert H\Vert_2 \)

其中

\(H_i = max(0,1+t\cdot y), \quad if\ \ i=label,\ 则t=-1; \quad 否则 \ t=1\)

下面举例说明，caffe中是如何计算多分类的Hinge Loss的：

比如我们要分5类，下表是分类器的5个输出，已知label=3.

ID	1	2	3	4	5
y	-1.73	-1.24	0.89	-0.99	0.05
t	1	1	-1	1	1

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

shuzfan

关注关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

理解Hinge Loss (折页损失函数、铰链损失函数)

jacke121的专栏

05-19

7168

理解Hinge Loss (折页损失函数、铰链损失函数) 原文：https://blog.csdn.net/fendegao/article/details/79968994 Hinge Loss是机器学习领域中的一种损失函数，可用于“最大间隔(max-margin)”分类，其最著名的应用是作为SVM的目标函数。在二分类情况下，公式如下： L(y) =max(0 , 1 –t⋅...

Caffe Loss层 - HingelossLayer

长风破浪会有时，直挂云帆济沧海

08-01

1740

HingelossLayer 计算 one-of-many 分类任务的 hinge loss. Hinge Loss 概念定义为： E(z)=max(0,1−z)E(z)=max(0,1−z)E(z) = max(0, 1-z) 常用在SVM的最大化间隔分类中. 对于期望输出t=+1,−1t=+1,−1t={+1,-1}和分类器分yyy，预测值yyy的 hinge...

参与评论您还未登录，请先登录后发表或查看评论

caffe hinge loss 解析

专注于机器学习，深度学习，人脸识别领域。

07-24

1033

输入： bottom[0]: NxKx1x1维，N为样本个数，K为类别数。是预测值。 bottom[1]: Nx1x1x1维， N为样本个数，类别为K时，每个元素的取值范围为[0,1,2,…,K-1]。是groundTruth。输出： top[0]: 1x1x1x1维，求得是hingeLoss。关于HingeLoss： p: 范数，默认是L1范数，可以在配置中设置为L1或者L2

李飞飞CS231n关于hinge loss函数求导的问题

qq_37099369的博客

07-05

1585

在做CS231 2020 Assignment1的SVM部分时，遇到了关于hinge loss的求梯度（求导）编程实现的问题，故在此记录一下。首先，给出hinge loss在多分类时的表达式： Li=∑j≠yimax(0,wjTxi−wyiTxi+Δ) L_i=\sum_{j\neq y_i}max(0,w_j^Tx_i-w_{y_i}^Tx_i+\Delta) Li=j=yi∑max(0,wjTxi−wyiTxi+Δ) 其中，Δ=1\Delta=1Δ=1。通过对www求偏导，可以得到

caffe源码解读(10)－hinge_loss_layer.cpp

冬后晚晴的博客

01-31

328

公式参数：两个输入bottom[0]、bottom[1],一个输出top[0]。 bottom[0]: N*C*1*1 预测值； bottom[1]: N*1*1*1 真实值； p: 范数，可选L1、L2L_{1}、L_{2}范数； δ{ln=k}\delta \left \{ l_{n}=k \right \}: 示性函数，如果第nn个样本的真实标签为kk,则δ{ln=k}=1\delta

caffe中HingeLossLayer层原理以及源码分析

tangwei2014的专栏

06-27

6737

输入输出 hingeloss原理前传传播原理反向传播原理

caffe层解读系列-softmax_loss

热门推荐

shuzfan的专栏

05-20

3万+

Loss Function 可选参数使用方法扩展使用Loss Functionsoftmax_loss的计算包含2步：（1）计算softmax归一化概率（2）计算损失这里以batchsize=1的2分类为例：设最后一层的输出为[1.2 0.8],减去最大值后为[0 -0.4]，然后计算归一化概率得到[0.5987 0.4013]，假如该图片的label为1，则Loss=-log0.

windows下安装caffe_ssd并添加centor_loss层

03-22

#define CAFFE_CENTER_LOSS_LAYER_HPP_ #include #include "caffe/blob.hpp" #include "caffe/layer.hpp" #include "caffe/proto/caffe.pb.h" #include "caffe/layers/loss_layer.hpp" namespace caffe { ...

caffe层解读系列——Data以及ImageData层用法

shuzfan的专栏

11-16

1万+

直接举一个data层的使用例子：layer { name: "cifar" type: "Data" top: "data" top: "label" include { phase: TRAIN } transform_param { mean_value: 128 mean_value: 128 mean_value: 128 .

精选资源

pose_iter_584000.caffemodel,pose_iter_584000.caffemodel百度网盘

08-31

openpose1.5.1（2019年）中训练好的身体数据。openpose中的批处理文件下载速度极慢，且容易中断。下载后将此文件解压放在openpose根目录下的\models\pose\body_25文件夹中。

hinge loss

小麦粒的Python

07-26

7686

在机器学习中，hinge loss作为一个损失函数(loss function)，通常被用于最大间隔算法(maximum-margin)，在网上也有人把hinge loss称为铰链损失函数，它可用于“最大间隔(max-margin)”分类，其最著名的应用是作为SVM的损失函数。而最大间隔算法又是SVM(支持向量机support vector machines)用到的重要算法(注意：SVM的学习算法有两种解释：1. 间隔最大化与拉格朗日对偶；2. Hinge Loss)。

Hinge Loss简介

richard_che的博客

05-18

1万+

Hinge Loss简介标准Hinge Loss Hinge本身是用于分类的Loss，给定Label y=±1y=\pm 1y=±1 这个Loss的目的是让预测值y^∈R\hat{y} \in Ry^∈R和yyy相等的时候，返回0，否则返回一个线性值基于2的需求，Hinge Loss的定义：L(y^)=max(0,1−y⋅y^)L(\hat{y}) = max(0, 1-y \cdot \hat{y})L(y^)=max(0,1−y⋅y^)。当yyy和y^\hat{y}y^相等，Loss等于0

Hinge loss

mjj_1094的博客

11-20

550

＃基础 The Hinge Loss 定义为 E(z) = max(0,1-z)，在图中是蓝色的线所表示的那个，the Log Loss 为红色的线所表示，而 the Square Loss 是绿色 the misclassification error 用黑色表示。 Figure 1 Figure 1 来自 Chris Bishop's PRML book Hinge Loss

caffe hinge _loss layer

u014114990的专栏

08-25

3103

铰链损失函数（Hinge Loss） study(3) 关于激活函数以及loss function" title="caffe study(3) 关于激活函数以及loss function" style="border:0px; max-width:100%; margin:0px; padding:0px; list-style:none"> 求和后便成了Hing

机器学习面试第2弹交叉熵损失vs.平方损失+ 合页损失函数HingleLoss+ 梯度下降函数的比较GD，SGD,Momentum，Adam

efei7968的博客

03-21

1492

1.为什么要用交叉熵损失代替平方损失为什么不用二次方代价函数权值和偏置的偏导数为求导过程偏导数受激活函数的导数影响，sigmoid函数导数在输出接近0和1时非常小，会导致一些实例在刚开始训练时学习得非常慢。为什么要用交叉熵求导结果这个梯度公式与激活函数对z的偏导数无关，只与激活函数作用于z后的输出与期望的输出y有关， ...

Hinge Loss与CE Loss的对比分析（全网最透彻清晰解释）

Xu_Wave

09-30

1279

Hinge Loss、CE Loss、面试题

线性分类器损失函数与最优化

快来学习鸭～～～

03-05

5968

author:DivinerShi线性分类器损失函数与最优化假设有3类 cat car frog第一列第二行的5.1表示真实类别为cat，然后分类器判断为car的的分数为5.1。那这里的这个loss怎么去计算呢？这里就要介绍下SVM的损失函数，叫hinge loss。如上图所示，我们去计算第一列的损失，计算方法如下：因为真实的类为cat，所以我们让其他两类的分数去减去真实类的分数，相当于去计算真

【损失函数】Hinge Loss 合页损失