这是一篇baidu research的paper。
主题为细力度分类。这个问题在于找到一些关键的细节。比如在鸟类数据集CUB上,专家往往也是通过鸟的尾巴,或者头部来对鸟类分类的。
What:
预测细力度分类的CNN+MDP的网络。
1. 融合了三个元素: 特征提取,attetion 和细力度分类一起训练。(比如有些之前paper是把attetion part额外切割出来的。如鸟的头部专门train个CNN。最后多个model fusion)
2. 使用了弱监督的增强学习(reinforcelearning),不需要额外的标注信息。(比如语义分割信息)
3. 全卷积网络提升了训练和测试速度。
4.贪心的奖励策略加速了收敛。
读前疑问:
1.最后怎么结合reinforce learning的?
其实attention的选择可以看成马尔科夫决策过程中的action(我选择哪个atttention去看)
最后的reward为分类结果的好坏。
How:
模型分为3个部分
1. Feature M