Multi-view Convolutional Neural Networks for 3D Shape Recognition
文章出自2015年ICCV, code & data戳这里:http://vis-www.cs.umass.edu/mvcnn/
本文立意之处:represent 3D shape 的descriptor种类繁多,最直观的descriptor生成自native 3D format,若是用view-based descriptor效果会如何?针对这个问题,文章从3D shape的不同视角生成2D 图片,利用常规的CNN训练,再对3D shape做分类、识别,效果远远好于直接用3D shape做训练数据的state_of_art的算法。
算法的框架见下图:
从3D Shape的不同视角生成2D图片,每张2D图片均通过卷积神经网络CNN1(注意,是同一个CNN1,参数是一样的),在View Pooling layer处融合为一个整体, 后面再接上一个卷积神经网络CNN2,最后接上常规softmax。