《BBN:Bilateral-Branch Network with Cumulative Learning for Long-Tailed visual Recognition》简读

最新推荐文章于 2023-06-27 09:48:18 发布

sunny_develop

最新推荐文章于 2023-06-27 09:48:18 发布

阅读量904

点赞数 2

分类专栏：文献深度学习文章标签：神经网络

本文链接：https://blog.csdn.net/guanyuqiu/article/details/109715509

版权

深度学习同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

文献

9 篇文章 0 订阅

订阅专栏

本文提出了一种名为BBN的模型，旨在解决数据集中的长尾问题。该模型由传统学习分支和数据再平衡分支组成，通过自适应权衡参数在训练过程中逐步重视数据再平衡。再平衡分支使用反向采样策略，根据类别样本数量的反比例进行采样。训练过程中，模型先关注传统学习，然后逐渐转向数据再平衡。最终，模型的输出结合了两个分支的权重，通过调整自适应权重参数来优化损失函数，以提高对少数类别的关注度。

摘要由CSDN通过智能技术生成

本文作者为了解决数据长尾的问题，作者提出了BBN模型，该模型分成两个分支，一个是传统的学习分支，另一个是数据再平衡分支。这两个分支利用参数 $\alpha$ 进行平衡， $\alpha$ 是根据训练的epochs的数量进行调整，它自适应调整整个模型，让模型首先关注传统的学习分支，之后逐渐关注数据再平衡分支。

数据平衡的一般策略：

再采样方法：该方法是数据平衡中的主要方式，可以分为两类：1.对于拥有大部分数据的类别进行降采样；2.对拥有小部分数据的类别进行过采样。
权重再调整：该方法是另一个数据平衡的重要方法，它的策略是分配大的权重给小的类别在损失函数中。然而在真实数据应用时该方法会导致优化困难。
两步调节策略：该方法是把训练过程分为两部分，第一步用原始不平衡的数据训练模型，第二步用很小的学习率和平衡后的数据微调模型。

BBN模型

如上图所示，文中提出的BBN模型包含两个分支，分别是传统学习和对数据再平衡学习。其中传统学习分支输入的是正常的数据分布，而再平衡分支则使用reversed sampler，即与每个类别样本数量成反比例关系的采样策略。每个样本的采样概率为：

其中

两个分支共享除了最后模块的所有权重，为了在训练阶段平衡两个分支。用自适应权衡参数 $\alpha$ 来平衡两个分支， $\alpha$ 采用自适应渐进式学习策略来进行调节，调节的方式是根据训练的epoch的数量调节，随着epoch的次数增多， $\alpha$ 的值减少，在inference阶段， $\alpha$ 设置为0.5， $\alpha$ 的调节公式如下：

两个分支的权重是 $f_{c}$ 和 $f{_{r}}$ ，权重 $f_{c}$ 和 $f{_{r}}$ 将要被送到分类器 $W_{c}\in \mathbb{R}^{D\times C}$ 和 $W{_{r}}\in \mathbb{R}^{D\times C}$ 中，则输出的结果是这些权重的和，输出的结果可以表示为：