论文阅读笔记之——《Bilinear CNNs for Fine-grained Visual Recognition》

最新推荐文章于 2022-04-02 14:53:15 发布

gwpscut

最新推荐文章于 2022-04-02 14:53:15 发布

阅读量2.1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gwplovekimi/article/details/95204796

版权

卷积神经网络专栏收录该内容

65 篇文章 6 订阅

订阅专栏

双线性定义：包含两个特征提取器，其输出经过外积(外积WiKi)相乘、池化后获得图像描述子。

通常情况下，在精细化的分类问题中，有两种方法：一是part-based model，通过定位关键部位并提取特征。二是holistic models，这种方式在整张图片上构造特征。

the accuracy of deep networks can be improved significantly by using two orders of magnitude more training data obtained by querying category labels （查询类别标签） on search engines.

second-order aggregation of features from two different layers of a CNN is effective at fine-grained recognition.

（对于高阶特征，目前所看的paper几乎都是说有效，但是并没有给出深入的分析~~~）

这篇文章的主要思想是对于两个不同图像特征的处理方式上的不同。传统的，对于图像的不同特征，我们常用的方法是进行串联（连接），或者进行sum,或者max-pooling。论文的主要思想是，研究发现人类的大脑发现，人类的视觉处理主要有两个pathway, the ventral stream是进行物体识别的，the dorsal stream 是为了发现物体的位置。论文基于这样的思想，希望能够将两个不同特征进行结合来共同发挥作用，提高细粒度图像的分类效果。论文希望两个特征能分别表示图像的位置和对图形进行识别。论文提出了一种Bilinear Model。下面就是bilinear cnn model的示意图

参考资料：

https://blog.csdn.net/qq_32768091/article/details/84145088

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
论文阅读笔记之——《Bilinear CNNs for Fine-grained Visual Recognition》

双线性定义：包含两个特征提取器，其输出经过外积(外积WiKi)相乘、池化后获得图像描述子。通常情况下，在精细化的分类问题中，有两种方法：一是part-based model，通过定位关键部位并提取特征。二是holistic models，这种方式在整张图片上构造特征。the accuracy of deep networks can be improved significantly by...
复制链接

扫一扫

专栏目录

gwpscut CSDN认证博客专家 CSDN认证企业博客

码龄10年

439: 原创

1万+: 周排名

1922: 总排名

211万+: 访问

: 等级

1万+: 积分

3341: 粉丝

2990: 获赞

772: 评论

1万+: 收藏

私信

关注

分类专栏

最新评论

实验笔记之——Gaussian Splatting SLAM （MonoGS）配置与测试
weixin_44956721: 请问您在使用gui界面的时候，是否会出现偶尔报错的情况呢？
实验笔记之——Gaussian Splatting SLAM （MonoGS）配置与测试
隔壁家老陈: 我也是这一步不行
学习笔记之——2D Gaussian Splatting（2DGS）
m0_62720695: 引用「由前面得到的2D Gaussian局部坐标系下点坐标为 (𝑢,𝑣,1,1) ，以及ray-spl」这里方程难道没解错吗?
ubuntu20.04采用nomachine连接时，需要连接显示器才可以操作
上单之光: 如何把桌面换为unity
学习笔记之——2D Gaussian Splatting（2DGS）
Terry1550: 原文：Different from NeRF, 3DGS’s volume rendering doesn’t consider the distance between intersected Gaussian primitives. Therefore, spread out Gaussians might result in a similar color and depth rendering. 意思是在做blending的时候即使各个3DGS点之间的距离很远最后也会和各个距离很近的3DGS点渲染出来的效果相似不能很好的约束平面性

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。