GVCNN——多视角分组选择

最新推荐文章于 2021-01-14 08:55:23 发布

考拉喜欢吃火腿

最新推荐文章于 2021-01-14 08:55:23 发布

阅读量1.1k

点赞数

分类专栏： 3D点云处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_24505417/article/details/108817187

版权

3D点云处理专栏收录该内容

18 篇文章 14 订阅

订阅专栏

GVCNN: Group-View Convolutional Neural Networks for 3D Shape Recognition CVPR2018

和MVCNN一样，基于多视图对三维物体进行识别分类的网络结构。GVCNN的核心思路是：对不同视角的特征进行区分度打分，落在同一得分区间的划分到同一组，同时给每组生成一个权重，用于加权聚合得到最终特征。分值用sigmoid限制在0~1范围内，然后事先将（0，1）区间划分成M个组。

感觉想法可以，但很难学习到分组信息。

网络整体结构：

FCN提取原始的视角特征 raw view descriptors；
CNN提取最终的视角特征 final view descriptors；
用raw视角特征作为Grouping Module的输入，计算分组结果和每组权重；
根据分组结果对final视角特征进行分组，并进行view pooling得到group descriptors；
用每组权重对group descriptors进行加权融合，得到最终的shape descriptor；
全连接分类。

Grouping Module

输入为N个原始视角特征Xi；
用共享的FC对输入特征进行处理，输出特征为Oi；
计算每个视角的得分si = sigmoid(log(abs(Oi)));
设分为M个组，计算第j个组的权重： $\xi(G_j) = \frac{Ceil(\xi_{I_k} \times |G_j|)}{|G_j|}, \ \ \ \ I_k \in G_j$ ；

考拉喜欢吃火腿

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。