样本均衡之OHEM

maxruan

于 2021-09-02 08:29:42 发布

阅读量420

点赞数 2

分类专栏： Deep Learning 文章标签：深度学习神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/long630576366/article/details/120052809

版权

Deep Learning 专栏收录该内容

21 篇文章 0 订阅

订阅专栏

论文地址：Training Region-based Object Detectors with Online Hard Example Mining

OHEM 主要解决神经网络中困难负样本的问题。

困难负样本是神经网络难以区分的负样本。我们希望模型在训练的时候，负样本的confidence接近0，但是如果不加干涉，总会有一些负样本不那么接近0。难样本挖掘就是要找到这些样本，针对性地训练。

主要贡献：

1、不需要设置正负样本的比例来解决类别不均衡的问题。
2、数据集越大，性能越加明显。

主要原理

1、根据损失进行筛选，选出对分类和检测影响大的样本。

2、将ROI网络进行扩充为2个，一个只有前向传播，计算loss，另一个正常前向和反向传播，但是只以hard example作为输入。计算损失和梯度回传。

那么问题来了，如何选择正负样本，如何选择难样本？

1、正负样本选取：
ROI 与groud truth IOU 大于0.5 为正，ROI 与所有groud truth IOU 均小于0.5 为负。这么选负样本应该会很多，可以提高IOU抑制负样本，比如选 0.6。
2、难样本：
选择ROI损失最大的样本，并使用NMS去重，设置IOU = 0.7,大于0.7的去除。

OHEM 作为一种设计思路，很容易嵌入到检测网络当中。下面以OHEM 嵌入到Faster-RCNN 为例子：
Faster RCNN 主要由：
主干卷积网络，ROI Pooling 网络，全连接网络和两个输出。

将OHEM 嵌入后如下：

在这里插入图片描述
（a）部分只计算loss，不进行方向传播，计算得出难例子样本。
（b）部分将难例样本作为输入，进行前向和反向传播，计算两个输出。

与排序取样本的区别

SSD 中难负样本挖掘：
按照置信度误差排序，选取较大误差的前k个作为训练负样本，同时保证正负样本的比例接近1：3。质量和数量的保证。

而OHEM是通过对hard samples进行训练，解决样本不平衡问题，同时提高了算法识别率

OHEM可以帮助2-stage检测算法提升训练效果，通过对ROI loss值进行排序从而筛选出loss值非常大的ROI，这便是所谓的“困难负例”。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
样本均衡之OHEM

论文地址：Training Region-based Object Detectors with Online Hard Example MiningOHEM 主要解决神经网络中困难负样本的问题。困难负样本是神经网络难以区分的负样本。我们希望模型在训练的时候，负样本的confidence接近0，但是如果不加干涉，总会有一些负样本不那么接近0。难样本挖掘就是要找到这些样本，针对性地训练。主要贡献：1、不需要设置正负样本的比例来解决类别不均衡的问题。2、数据集越大，性能越加明显。主要原理1、根据损
复制链接

扫一扫

专栏目录

maxruan CSDN认证博客专家 CSDN认证企业博客

码龄11年

52: 原创

14万+: 周排名

3万+: 总排名

10万+: 访问

: 等级

686: 积分

38: 粉丝

91: 获赞

19: 评论

443: 收藏

私信

关注

热门文章

分类专栏

CUDA 6篇
计算机视觉 6篇
Deep Learning 21篇
工具 1篇
编程 12篇
图像处理 7篇
软件安装 6篇
pytorch 1篇

最新评论

torch转ONNX模型转TensorRT C++推理
Super.Bear: 网上找找有官方提供的这个头文件，拉下来用就行了
torch转ONNX模型转TensorRT C++推理
zzzDestiny: 请问Nvidia自带的logging,h可以说的具体一点吗？
目标框检测中准确率、召回率、AP、mAP计算原理及代码
AAYYYYY: OSError: [WinError 123] 文件名、目录名或卷标语法不正确。: '\u202aF:/XT/0925/output/gt_coco_json/'请问这是为啥呢
torch转ONNX模型转TensorRT C++推理
学，习好难: 好滴解决了
torch转ONNX模型转TensorRT C++推理
maxruan: 按你模型的输出格式进行解析，不同模型输出格式不一样

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。