优质博客推荐 及 我的博客目录

优质博客推荐 及 我的博客目录 说明: 颜色 SlateBlue 表示我的原创博客 颜色 Chartreuse 表示我推荐的博客或者课程

2017-12-25 13:42:47

阅读数 295

评论数 0

CUDA经验:NVCC编译器过度优化(Reduce算法)

  在GPU中Reduce算法是一种快速归约数据的方法,具体内容单击此处跳转。在CUDA实现的过程中,如果处理不当,会导致Debug版本与Release版本结果不一致的现象,这是由于Debug下不会对代码做优化,而Release下“过度优化”了代码,导致程序并没有按照我们的原意执行,最终结果错误。...

2018-08-12 21:19:49

阅读数 229

评论数 0

矩阵求逆引理(Matrix inversion lemma)推导

矩阵求逆引理(Matrix inversion lemma),通过分块矩阵求逆的方法证明:(A - C B^inv C')^inv = A^inv - A^inv C (B - C' A^inv C)^inv C' A^inv

2018-07-01 17:36:40

阅读数 2474

评论数 0

KinectFusion公式推导、理解

“KinectFusion Real-Time Dense Surface Mapping and Tracking”一文于2012年发表,该文章首次实现了实时稠密重建(Real time dense restruction),我认为微软的Kinect深度相机是其成功的根本,该文章也是首次成功应用...

2017-12-30 10:41:01

阅读数 1276

评论数 1

罗德里格斯公式 理解、推导

罗德里格斯公式(Rodriguez formula)是计算机视觉中的一大经典公式,在描述相机位姿的过程中很常用。公式:R=I+sin(θ)K+(1−cos(θ))K2R = I + sin(\theta)K + (1 - cos(\theta))K^{2}   从旋转矩阵RR讲起,在三维空间中,旋...

2017-12-29 16:55:19

阅读数 7917

评论数 5

深度相机SLAM文献、关键概念总结

基本概念 深度相机(Depth Camera)与彩色相机(Color Camera)。众所周知,彩色相机就是照相用的,目的在于采集目标物体的颜色信息,保存到对应的像素点。而深度相机的目的是采集目标物体和相机之间的距离,并保存到对应的像素点。 深度图像(Depth Image)与彩色图像(C...

2017-12-25 20:59:29

阅读数 748

评论数 0

CUDA学习笔记(7) GPU内存分级

在NVIDIA的GPU中,内存(GPU的内存)被分为了**全局内存(Global memory)、本地内存(Local memory)、共享内存(Shared memory)、寄存器内存(Register memory)、常量内存(Constant memory)、纹理内存(Texture mem...

2017-12-25 13:38:34

阅读数 1383

评论数 0

CUDA学习笔记(6) 共享内存与全局内存

共享内存(Shared memory)是位于每个流处理器组(SM)中的高速内存空间,主要作用是存放一个线程块(Block)中所有线程都会频繁访问的数据。流处理器(SP)访问它的速度仅比寄存器(Register)慢,它的速度远比全局显存快。但是他也是相当宝贵的资源,一般只有几十KByte,  这里以...

2017-12-22 13:07:36

阅读数 3700

评论数 3

CUDA学习笔记(5) 原子操作

原子操作必须**连贯地执行**,中间不能插入任何其他操作。

2017-12-21 13:57:49

阅读数 2436

评论数 0

CUDA学习笔记(4) CUDA计时函数

用clock()精确地记录核函数运行的时间可以让我们直观地了解核函数代码的运行效率。

2017-12-17 19:09:11

阅读数 1214

评论数 2

CUDA学习笔记(3) NVRTC编译库

注意,NVRTC可以高速地编译代码,但是NVRTC并不支持C++,大型工程尽量避免使用。   我们在编译CUDA工程时,会发现比C++代码的编译慢上许多,这是由于NVCC(CUDA/C++编译器)造成的,它可以兼容地编译C++代码与CUDA-C代码,但是十分低效。   我们可以用CUDA学...

2017-12-13 12:31:38

阅读数 942

评论数 0

CUDA学习笔记(2) 第一个CUDA程序

首先,我们用VisualStudio创建了CUDA的工程后,会出现一个数组对应位置元素求和的模版代码,我们可以先借此了解CUDA工程的主体结构,然后将他们全都删掉,从头开始练习。   假设我们现在要创建384个线程,并要知道他们具体属于哪个线程束(Warp)、线程块(Block),线程序号是多少...

2017-12-10 12:44:36

阅读数 302

评论数 0

CUDA学习笔记(1) 硬件简介

一、环境配置与安装 Linux下安装请参考Ubuntu12.04配置NVIDIA cuda5.5经验帖 Windows下安装请参考CUDA在Windows的安装和使用   我是在Windows下安装的CUDA,使用Visual Studio 2013编程。安装过程是只用点确定的傻瓜式安装,并且会...

2017-12-03 19:43:47

阅读数 454

评论数 0

CSDN-markdown使用实践(测试)

零、LaTex数学公式通过在线LaTeX公式编辑器可以直接生成LeTaX公式,然后复制到博客中并在两端加上“$”符号即可,例:$ x = \dfrac{-b \pm \sqrt{b^2 - 4ac}}{2a}$ $$ x = \dfrac{-b \pm \sqrt{b^2 - 4ac}}{2a}$...

2017-11-20 18:52:25

阅读数 1293

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭