背景介绍
- Fine-grained visual categorization (FGVC):
目标:目的是区分目标的子类别,如不同种类的鸟和不同种类的花。
挑战:由形变、遮挡、光照引起的高类内差异和低类间差异。 - Attention Convolutional Binary Neural Tree:
CNN在图像分类取得了好的效果,但很难描述子类之间的区别,本文设计了一种树结构的注意力神经网络,能够由粗到细层次特征学习,不同的分支注意不同的局部位置,实验表明这种树结构神经网络的良好性能。 - 本文贡献
- 提出了一种新的注意卷积二叉神经树结构。
- 在树型网络中引入注意力变换器以便于粗到细的层次特征学习。
- 在三个具有挑战性的数据集上进行的大量实验表明了本文方法的有效性。
相关工作
- Deep supervised methods:
使用目标注释,检测到局部判别区域,再进行细粒度分类;缺点就是依赖密集性注释,限制实际应用。 - Deep weakly supervised mthods:
仅仅使用图片级注释,利用注意力机制学习判别区域;在单个网络上使用注意力,限制了模型性能。 - Decision Tree:
决策树是一种有效的分类方法,学习数据的层次聚簇,如何分割输入空间,以便在每个子集中,线性模型足以解释数据;由于DT通常使用简单的路径函数,它在表达能力方面是具有局限性的。 - Attention mechanism:
注意机制在模仿人类视觉机