PointNet 网络结构

COOLRANEN

已于 2023-07-25 16:42:08 修改

阅读量572

点赞数

分类专栏： 3维点云文章标签：深度学习人工智能

于 2023-07-13 15:57:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57122465/article/details/131703698

版权

3维点云专栏收录该内容

3 篇文章

订阅专栏

最近在学习点云，首先便是开山之作pointnet

PointNet: Deep Learning on Point Sets for 3D Classifification and Segmentation

一、点云的特性

1.Unordered

点云是无序的，点的排序不影响物体的性质，如下图所示：

2.Interaction among points

该模型需要能够从附近的点捕获局部结构，以及局部结构之间的组合相互作用

3.Invariance under transformations

旋转不变性，即一个点云数据旋转后仍然表达的是同一个物体

这个在原文中主要采用的是一个T-net来实现

T-Net网络是可以去学习点云的旋转从而给予校正，给后面的网络使用。

二、网络结构

pointnet的结构很简单，主要可以完成分类以及分割的任务，首先是分类任务，输入n个点的三维数据(x,y,z),经过一个input transform层，n个点三维数据经过多层感知机mlp，将三维数据输出为64维，然后在特征转换层feature transform后经过多层感知机将每个点依次从64输出到128再到1024，自此每个点都包含1024的数据，然后经过maxpool 层提取global feature，将所有点的每一个维度比大小，提取每一个维度的最大值，得到一个1x1024大小的向量，这包含了全局信息，然后在用mlp层，将信息进一步提取到512，到256，然后到输出的分类数k，最后经过softmax输出每一个类别的分数从而完成分类的任务。

分割任务主要是在第二个transform层后将提取到的局部信息nx64与global feature复制n份粘贴到一起，每一个点的信息包括自己的64维信息加上全局信息1024，总共1088维，融合了语义与空间的信息，然后在由mlp重新提取新特征到128维，然后是再到分割类别m维，至此每个点都是m维信息，n个点每个点表达m类别中的一个。输出逐点的类别，从而完成分割。

博客等级

码龄4年

9
原创

12
点赞

49
收藏

192
粉丝

关注

私信

热门文章

分类专栏

3维点云 3篇
深度学习 5篇

最新评论

Resnet 18 及34 的代码复现（基于李沐的动手学深度学习）
编程开发者: 问一下哈，最后的卷积层？我查阅资料没看到这个层，是不是最后的全连接算一层？ 1+4+4+4+4 这是卷积层，后边再接一个全局平均池化+全连接层，这就结束了
Resnet 18 及34 的代码复现（基于李沐的动手学深度学习）
炸膛坦客: 初始的卷积层+残差块中4*2*2+最后的卷积层，skip跳跃连接中的卷积层不算在内，总共18个
Resnet 18 及34 的代码复现（基于李沐的动手学深度学习）
编程开发者: 我看了你的评论。是这样的，我只是疑惑残差块中的卷积层的个数，我也看过其他视频的教学，这个18层说实话，我没弄明白是怎么来的。
Resnet 18 及34 的代码复现（基于李沐的动手学深度学习）
炸膛坦客: 他这个代码有问题，你看我的评论
Resnet 18 及34 的代码复现（基于李沐的动手学深度学习）
炸膛坦客: 博主你代码错了啊......print模型之后才找到的错误 resnet_block函数的内容应该是这样的： def resnet_block(in_channels, out_channels, num_residuals, first_block=False): blk = [] for i in range(num_residuals): stride = 2 if i == 0 and not first_block else 1 # 从第二个大残差结构开始, 结构中的第一个残差块一般都会尺寸减半, 即 stride=2 use_1x1conv = i == 0 and not first_block # use_1x1conv = False/True, 从第二个大残差结构开始, 结构中的第一个残差块都是卷积映射残差块 if i == 0: blk.append(Residual_primary(in_channels, out_channels, use_1x1conv=use_1x1conv, strides=stride)) else: blk.append(Residual_primary(out_channels, out_channels, strides=stride)) return nn.Sequential(*blk)

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。