![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
江玦
这个作者很懒,什么都没留下…
展开
-
inception denseGCN函数产生的结果是四维的原因
这个函数的输入x是点云的特征,通常情况下点云特征是二维或三维的,例如[num_points, num_features]或者[batch_size, num_points, num_features]。这里为了使用卷积,输入x的最后一维被扩展为num_features个通道,所以输入变为[batch_size, num_points, 1, num_features],是一个四维Tensor。所以这里人为地对输入进行扩展,把特征的最后一维扩展成“通道”的形式,以方便后续的2D卷积操作。原创 2023-08-07 22:57:58 · 123 阅读 · 1 评论 -
关于pointnet的几个点
1.为什么将维数从一开始3维变成1024维后再进行池化。一开始输入只有xyz三维,(x,y,z),如果进行最大池化(maxpool),会损失太多信息,输出的全局特征仅仅继承了三个坐标轴上最大的那个特征。但如果将点映射到1024维的高维空间再进行最大池化,则1024维所有通道上都只保留最大的那一个,比起3维池化却是能保留更多,保留了1024个,损失的信息会减少很多。2.T-net对于普通的PointNet(vanilla),如果先后输入同一个但是经过不同旋转角度的物体,它可..原创 2021-11-28 22:49:52 · 1570 阅读 · 0 评论 -
为什么需要卷积?为什么下采样过程中channels不断增加?
原始图像的特征信息是最完整的,但是为啥还要卷积呢?因为原始图像比如1024乘768的图像,算一下多少个像素点,如果作为输入,下一层(隐含层)有10的5次方个神经元的话,再算算有多少个参数,但是如果用卷积核来卷积,即便用了100多个卷积核去提取特征,参数比起我刚才说的原始图像减少非常非常多,这就是我们需要CNN的原因。还有就是既然卷积了,换句话就是缩小了图像,那为了保证图像精度最大程度上不丢失,就需要多个卷积核,这样就可以保证在降维的同时不失真。然后CNN的层数越多,越深,理论上整个网络中的参...原创 2021-11-19 20:12:38 · 7301 阅读 · 3 评论