![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
细粒度
文章平均质量分 56
大坡山小霸王
这个作者很懒,什么都没留下…
展开
-
21-ICME-FINE-GRAINED IMAGE RETRIEVAL VIA MULTIPLE PART-LEVEL FEATURE ENSEMBLE
MPFE(MULTIPLE PART-LEVEL FEATURE ENSEMBLE) AAPD基于注意激活的零件检测器 特征图: 1 CAD(通道式注意力检测): MP最大池化k-max-pooling MLP 两层全连接层(编码通道间关联信息)【μ是c维向量?经过两层全连接还是c维?】 softmax标准化 激活图 : 【和MA-CNN类似,给特征图赋权重,相当于分类】 2 PS(部件选择): SCDA MPFE多零件级特征集成 Loss原创 2022-04-10 21:13:25 · 522 阅读 · 2 评论 -
20-ECCV-Fine-Grained Visual Classification via Progressive Multi-Granularity Training of Jigsaw Patc
Progressive Multi-Granularity(渐进多粒度) Training of Jigsaw Patches(拼图) 渐进训练(Progressive Multi-Granularity,PMG) 网络的浅层学习细粒度的特征 在当前步骤中训练的参数将作为参数初始化传递到下一个训练步骤,利用在前面发现的更小粒度的信息 当前预测中使用的所有参数都将得到优化,即使它们可能已经在前面的步骤中更新 拼图生成(jigsaw puzzle generator) 通过简单的渐进训练原创 2022-04-08 20:36:33 · 524 阅读 · 0 评论 -
17-ICCV-Learning Multi-Attention Convolutional Neural Network for Fine-Grained Image Recognition
MA-CNN多注意力 part generation和feature learning相互强化【和RA-CNN类似】 首先固定卷积层W,通过Lcng优化F。 其次固定F,通过Lcls调整W。 【复现代码loss也是和MMAL代码一样直接求和再反向传播的,关键通过detach控制】 论文中写的还是裁剪原图得到part图片重新又用part-CNN学习了P。 Mask峰值点Mi的原图对应点为中心,裁剪96x96区域放大(224*224)->PN 1定位:聚类响应区域相近的通道。原创 2022-04-07 20:42:35 · 438 阅读 · 0 评论 -
20-CVPR-Multi-branch and Multi-scale Attention Learning for Fine-Grained Visual Categorization
MMAL-Net多分支多尺度 对比RA-CNN 1参数是用不同尺度图像训练的所以可以分类不同尺度图像。the parameters of CNN and FC in our three branches are shared. Therefore, through the common learning process of the three branches, the trained model has a good classification ability for differen原创 2022-04-03 19:02:12 · 2050 阅读 · 0 评论 -
17-CVPR-Look closer to see better Recurrent attention convolutional neural network for fine-grained
RA-CNN循环注意力 1预训练的VGG初始化b1-b3,c1-c3【每个分支参数不同】 2最后一个卷积层(VGG-19的conv5_4)里选取最大响应区域作为APN的输出区域[tx,ty,tl],边长初始化为原始图像的一半。用来预训练d1-d2。 3交替训练。固定APN参数学习Lcls,固定CNN参数学习Lrank。 【定位一开始还是使用了卷积层输出的最大响应区域,后来Lrank对APN优化是弱监督】 4多尺度联合表示分类结果 {F1,F2…FN}独立归一化+拼接->全原创 2022-04-03 16:50:09 · 413 阅读 · 0 评论 -
15-ICCV-Bilinear CNN Models for Fine-grained Visual Recognition
Bilinear CNN(双线性) 1、特征学习方式:两个网络学习同一张图片 2、特征融合方式: 对应位置的两个特征描述符求外积,所有位置求和池化(SCDA视角类似) 传统的特征融合方法: sum/avg:只用了一阶信息。bilinear pooling 用了二阶统计信息,意在当一阶信息相同的时候利用二阶信息的不同来做分类。 feature concatenation:从代数上可以看做direct sum。 bilinear pooling可以看做direct product。特原创 2022-04-02 14:53:15 · 947 阅读 · 0 评论