code: https://isrc.iscas.ac.cn/gitlab/research/acnet
paper: https://arxiv.org/pdf/1909.11378.pdf
引言
细粒度视觉分类(FGVC)旨在区分从属对象类别,例如不同种类的鸟类[42,52]和花卉[1]。由于变形、遮挡和光照引起的高组内和低组间视觉差异,使得FGVC成为一项极具挑战性的任务。
CNN在图像分类取得了好的效果,但很难描述子类之间的区别。
本文设计了一种树结构的注意力神经网络,能够由粗到细层次特征学习,不同的分支注意不同的局部位置,实验表明这种树结构神经网络的良好性能。
定义: 输入图片X; 输出标签Y
定义网络:(T,O),T表示树的拓扑结构,O表示T边上的操作集。
完全二叉树:T={V,𝜀},V={𝑣_1,𝑣_2,⋯, 𝑣_𝑛}表示树种节点的集合,n表示节点的数量。𝜀={𝑒_1, 𝑒_2,⋯, 𝑒_𝑘}表示节点之间边的集合。
𝑘=2^ℎ−2,k表示边的数量; 𝑛=2^ℎ−1,h表示树T的高度
体系结构:<