Multi-view Convolutional Neural Networks for 3D Shape Recognition

最新推荐文章于 2024-07-23 17:18:01 发布

弓如霹雳弦惊

最新推荐文章于 2024-07-23 17:18:01 发布

阅读量3.5k

点赞数

分类专栏：深度学习文章标签： multi-view 3d

本文链接：https://blog.csdn.net/Dilusense/article/details/54630473

版权

本文提出了一种使用多视图卷积神经网络（MVCNN）进行3D形状识别的方法。通过从不同视角生成2D图像，并使用共享参数的CNN进行特征提取，然后在视图池化层融合特征，MVCNN在3D形状分类任务中表现出色，优于仅使用3D形状数据的现有最佳算法。

摘要由CSDN通过智能技术生成

Multi-view Convolutional Neural Networks for 3D Shape Recognition

文章出自2015年ICCV, code & data戳这里：http://vis-www.cs.umass.edu/mvcnn/
本文立意之处：represent 3D shape 的descriptor种类繁多，最直观的descriptor生成自native 3D format，若是用view-based descriptor效果会如何？针对这个问题，文章从3D shape的不同视角生成2D 图片，利用常规的CNN训练，再对3D shape做分类、识别，效果远远好于直接用3D shape做训练数据的state_of_art的算法。
算法的框架见下图：
这里写图片描述
从3D Shape的不同视角生成2D图片，每张2D图片均通过卷积神经网络CNN1（注意，是同一个CNN1，参数是一样的），在View Pooling layer处融合为一个整体，后面再接上一个卷积神经网络CNN2，最后接上常规softmax。