【深度学习】处理不平衡样本

JNingWei

已于 2023-01-25 16:17:42 修改

阅读量6k

点赞数

分类专栏：深度学习文章标签：深度学习人工智能计算机视觉

于 2018-02-03 21:40:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JNingWei/article/details/79249195

版权

深度学习专栏收录该内容

79 篇文章

订阅专栏

Introduction

不平衡样本：

训练样本中各类别间数量差距较大。

易导致过拟合，影响在 极端测试集 (量少类样本居多) 上的 泛化能力 。

对不平衡样本的处理手段主要分为两大类：数据层面 (简单粗暴)、算法层面 (复杂) 。

Note：
为了简明扼要，以下称量少的类别为 量少类，反之亦然。

数据层面

1. 数据重采样

	上采样	下采样
使用情况	数据不足时	数据充足 (支撑得起你的浪费)
数据集变化	增加	间接减少(量大类被截流了)
具体手段	大量复制量少类样本；数据扩充	批处理训练时，控制从量大类取的图像数量
风险	过拟合

2. 类别平衡采样

通过设计 样本列表 来实现平衡采样。

算法层面

在目标函数中，增加 量少类 样本 被错分 的 损失值 。

1. 基于代价敏感矩阵的代价敏感

利用 $\times K$ 的矩阵 $C$ 对不同样本类别施加错分惩罚。

2. 基于代价敏感向量的代价敏感

每个样本 都具有自己的代价敏感矩阵。一旦这样些代价敏感矩阵相同，则该方法退化为“基于代价敏感矩阵的代价敏感向量”。

Example：

Focal Loss
focal loss 的出现，是一个伟大的里程碑。它的出现，直接将类别不平衡处理从原来繁杂的人工时代进化到了 纯计算时代 。管你类别再不平衡，只需一个简单的公式，统统搞定：
$FL(p_t)=-(1-p_t)^\gamma\log(p_t)$

[1] Focal Loss for Dense Object Detection

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。