自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 map_merge_3d学习(一)

讲了map_merge3d论文中的部分名词概念以及算法

2023-10-27 11:38:17 163 1

原创 PVN3D: A Deep Point-wise 3D Keypoints Voting Network for 6DoF Pose Estimation学习笔记

在这项工作中,我们提出了一种新的数据驱动的鲁棒的6DoF目标姿态估计方法,从单个RGB-D图像。与以前直接回归姿势参数的方法不同,我们使用基于关键点的方法来处理这一具有挑战性的任务。具体地说,我们提出了一种深度霍夫投票网络来检测物体的3D关键点,然后以最小二乘拟合的方式估计出6D姿态参数。我们的方法是成功地在基于RGB的6DoF估计上工作的2D Keypoint方法的自然扩展。该算法充分利用了刚体目标的几何约束和额外的深度信息,便于网络学习和优化。通过大量的实验验证了3D-KeyPoint检测在6D位

2022-04-13 19:42:11 1448

原创 Normalized Object Coordinate Space for Category-Level 6D Object Pose and Size Estimation学习笔记

本文的目的是估计RGB-D图像中不可见对象实例的6D姿态和尺寸。与 “实例级” 6D姿势估计任务相反,我们的问题假设在训练或测试时间内没有确切的对象CAD模型可用。为了处理给定类别中的不同和不可见的对象实例,我们引入了归一化对象坐标空间(NOCS)——一个类别中所有可能的对象实例的共享规范表示。然后训练我们的基于区域的神经网络,以直接推断从观察到的像素到该共享对象表示(NOCS)的对应关系以及其他对象信息,如类别标签和实例掩码。这些预测可以与深度图相结合,以联合估计杂乱场景中多个对象的度量

2022-04-10 16:52:06 4289

原创 ShellNet: Efficient Point Cloud Convolutional Neural Networks using Concentric Shells Statistics学习笔记

以往的方法虽然能够在各种场景理解任务中达到较好的准确率,但训练速度往往较慢,网络结构复杂。本文针对这些问题,提出了一种有效的端到端置换不变卷积算法用于点云深度学习。我们名为ShellConv的简单而有效的卷积运算符使用同心球壳的统计数据来定义代表性特征并解决点序不规则性,从而允许对这些特征执行传统卷积。在ShellConv的基础上,我们进一步构建了一个高效的神经网络ShellNet,在保持较少层数的情况下,直接消耗接受野较大的点云。

2022-04-07 19:37:40 1143

原创 深度图像转化为点云

        首先我们先知道什么是相机的焦距。摄影机或放映机的金属筒容纳了一组两边或一边有弧度(凸或凹)的透镜,组成一个综合镜头。从物体不同部分射出的光线,通过镜头之后,聚焦在底片的一个点上,使影像具有清晰的轮廓与真实的质感,这个点就叫焦点(focus)。所谓焦距(focal length),正是从镜头之镜片中间点到光线能清晰聚焦的那一点之间的距离 。        现在我们看看深度图像是如何转换为点云的:图1 :(

2022-03-10 19:20:18 7117

原创 6-PACK: Category-level 6D Pose Tracker with Anchor-Based Keypoints学习笔记

6-PACK: Category-level 6D Pose Tracker with Anchor-Based Keypoints

2022-02-03 16:41:31 2595

原创 PointWeb: Enhancing Local Neighborhood Features for Point Cloud Processing学习笔记

摘要        文章提出了可以用于从点云的局部邻域中提取上下文特征得新方法pointweb。与以往的工作不同,我们更加考虑局部点之间的联系,能够根据局部区域的特征来扩展每个点的特征,从而能更好地表示区域的特征。同时提出了一种新的自适应特征调整(AFA)模块,用于寻找点与点之间的交互作用。对于每个局部区域,构建一个影响矩阵,将影响矩阵映射用于后面特征差别的映射根据自适应学习的影响指标,每个特征被同一区域的其他特征拉或推。调整后的特征与区域信息进行了很好的编码,有利

2022-01-20 19:23:22 579

原创 PointConv: Deep Convolutional Networks on 3D Point Clouds学习笔记

PointConv: Deep Convolutional Networks on 3D Point CloudsWenxuan Wu, Zhongang Qi, Li Fuxin CORIS Institute, Oregon State University

2022-01-19 21:02:52 731

原创 PointSIFT: A SIFT-like Network Module for 3D Point Cloud Semantic Segmentation学习笔记

SIFT: 尺度不变特征转换(Scale-invariant feature transform或SIFT)是一种电脑视觉的算法用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe在1999年所发表,2004年完善总结。

2021-12-03 13:45:15 755

原创 PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation论文笔记(三)

3D数据的处理历史:multi-view CNN    使用三维数据的多视图表示是将二维深度学习技术应用到三维场景下的最简单的方式。这是一种将三维感知问题转化为二维感知问题的明智做法,但它仍然在某种程度上允许你对物体的三维几何结构进行推理。早期的利用这种思想的基于深度学习的工作是 Su 等人在 2015 年提出的 multi-view CNN。    这是一种简单却十分有效的网络架构,它可以从三维物体的多个二维视图中学到特征描述符。实现这种方法与对目标分类任务使

2021-10-31 10:49:35 321

原创 基于CIFAR10数据集的识别网络应用(pytorch)

 学习pytorch的过程中搞了一个小小的应用,和大家分享分享。数据集数据集:CIFAR10        该数据集共有60000张彩色图像,这些图像是32*32,分为10个类,每类6000张图。这里面有50000张用于训练,构成了5个训练批,每一批10000张图;另外10000用于测试,单独构成一批。测试批的数据里,取自10类中的每一类,每一类随机取1000张。抽剩下的就随机排列组成了训练批。注意一个训练批中的各类图像并不一定数量相同,总的来看训练批

2021-10-30 15:54:50 1074

原创 PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation论文笔记(二)

我们可以利用max函数(对称函数)设计一个很简单的点云网络,如下:但是这样的网络有一个问题,就是每个点损失的特征太多了,输出的全局特征仅仅继承了三个坐标轴上最大的那个特征,因此我们不妨先将点云上的每一个点映射到一个高维的空间(例如1024维),目的是使得再次做MAX操作,损失的信息不会那么多。此时我们发现,当我们将点云的每个点先映射到一个冗余的高维空间后,再去进行max的对称函数操作,损失的特征就没那么多了。由此,就可以设计出这PointNet的雏形,称之为PointNet(vanilla):

2021-10-26 21:04:56 111

原创 Yolo学习(框架分析)

Yolo中文意思是You only look once.意思就是只需要看一次就可以识别出图中的这个物体。Yolo是单阶段的,不同于之前的双阶段的RCNN、Fast-RCNN。

2021-10-14 10:37:41 565

原创 PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation论文笔记(一)

quantization artifacts:量化伪影,视频压缩过程中的量化噪声导致称作“伪影” 的特定视觉误差。变换模型是指根据待匹配图像与背景图像之间几何畸变的情况,所选择的能最佳拟合两幅图像之间变化的几何变换模型。可采用的变换模型有如下几种:刚性变换、仿射变换、透视变换和非线形变换等,如下图:如果一幅图像中的两点间的距离经变换到另一幅图像中后仍然保持不变,则这种变换称为刚体变换(Rigid Transform)。。刚体变换仅局限于平移、旋转和反转。如果一幅图像中的直线经过后映射到另一幅图像上仍

2021-09-26 17:16:31 348

原创 pandas,numpy的学习

pandasPandas 是 Python 语言的一个扩展程序库,用于数据分析。Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。Pandas 名字衍生自术语 “panel data”(面板数据)和 “Python data analysis”(Python 数据分析)。Pandas 一个强大的分析结构化数据的工具集,基础是 Numpy(提供高性能的矩阵运算)。Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel

2021-09-04 23:26:11 676

原创 深度学习——函数、类、爬虫

深度学习——函数、类、爬虫Python 函数函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。优点:函数能提高应用的模块性,和代码的重复利用率。定义函数你可以定义一个由自己想要功能的函数,以下是简单的规则:函数代码块以 def 关键词开头,后接函数标识符名称和圆括号()。任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。函数内容以冒号起始,并且缩进。return [表达式] 结束函数,选择性地

2021-09-04 21:24:53 199

原创 ImageNet Classification with Deep Convolutional Neural Networks 学习笔记

ImageNet Classification with Deep Convolutional Neural Networks 学习笔记Deep Convolutional Neural Network 深度卷积神经网络(DCNN);Abstract 概要convolutional adj. 卷积的;回旋的;脑回的;high-resolution 高分辨率;state-of-the-art 最先进的;parameter 参数;neurons 神经元;layer 层;max-poolin

2021-09-04 21:05:27 297

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除