读博笔记
文章平均质量分 77
Gamma and Beta
这个作者很懒,什么都没留下…
展开
-
PF-NET与3D点云补全
和一般的MLP不一样的点是,一般的MLP是只会在最后一层使用max pooling,CMLP是对MLP中每一层的特征都做一次max pooling, 最终的特征是把每一个使用max pooling 得到的特征拼接起来。形成一个分辨率的隐编码,然后将不同分辨率的隐编码拼在一起形成最终的隐编码用于描述输入的残缺点云。这个问题在实际解决的时候主要有2个问题,第一就是点云补充得过于完整,比如目标点云中是有缺口,但是补全的过程往往会顾虑掉这些细节,其二,补得过于稀疏,补充的点云没有很好的填补缺失部分。原创 2024-04-30 19:36:08 · 255 阅读 · 0 评论 -
Pointnet和Pointnet++提取点云特征的思想
同理的,如果点多于20个点,就将点按照离中心的距离,从近到远排列起来,将多出的部分抛弃。为了尽可能多的提取特征,pointnet++使用配合了多种半径(指cluster的大小)和cluster中点的数量,并将得到的不同的特征整合成一个特征作为最终的特征。首先需要知道的是点云数据主要携带的信息,它所携带的信息通常是它在3D空间中的坐标和对应的点所携带的法向量。但是对于点云而言点和点之间进行位置交换是不会影响点云整体表示的,换句话说如果点云是一辆车,就算交换一些点的位置,点云还是表示的一辆车。原创 2024-04-29 22:41:39 · 373 阅读 · 0 评论 -
VAE在3D点云上应用总结
但是有一个问题是需要注意的,就是在训练VAE的时候,从pytorch的角度上来讲,decoder的输入是从encoder输出的分布中的采样得到的,但是采样会导致computational graph上出现nondeterminitic node, 从而导致无法最反向传播。这种结构比较可以用到3D人物的点云生成上面,因为3D人体每个部分的细节分布是不一样的,比如身体的shape可以用稀疏点云就可以大致的描述出它的形状了,但是脸部和手部,如果使用同样分布的稀疏点云,就很难描述出脸部的细节,比如五官。原创 2024-04-26 15:53:43 · 688 阅读 · 0 评论 -
Vision Transformer 总结
Transformer 简单总结和理解原创 2024-04-24 17:30:33 · 429 阅读 · 0 评论 -
Drivable 3D Gaussian Avatars 论文笔记
我个人的理解是这里需要一个volume的概念, 因为cage-based deformation的核心其实是将cage看成是coarse proxy,所以在cage里面的点就显得很重要,而一般triangle surface 它很难提供volume的概念,因为一个triangle在空间中只是平面的一个小部分, 而四面体 tetrahedra 本身就可以提供volume的概念。比如文中将 3D 高斯的Mean 表示成了从低分辨率的Mesh 采样的点的位置。这么做就等于是将之前的形变表示,转移到的高斯上。原创 2024-01-22 05:49:05 · 1374 阅读 · 0 评论