自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 树莓派+python opencv实现远程监控

近来风闻住宿地不太安全,正好手边有个树莓派,花了些时间用树莓派实现了远程监控,下面和大家分享一下,希望有所帮助。因为非计算机视觉专业人士,所以使用了python版的opencv,方便快捷。如何在pc上安装python opencv见http://luugiathuy.com/2011/02/setup-opencv-for-python/,曾经见着有中文的桥段找不着在哪里了,对不住了各

2013-06-24 22:52:19 33442 9

原创 Heterogeneous Parallel Programming(异构并行编程)学习笔记(七)

这里主要介绍MPI框架,以及怎样将其与CUDA结合起来运用。1. MPIMPI可以视为大一号的CUDA。一个MPI框架由分布式计算节点组成,每一个节点可以视为是一个“Thread”,但这里的不同之处在于这些节点没有所谓的共享内存,或者说Global Memory。所以,在后面也会看到,一般会有一个节点专门处理数据传输和分配的问题。MPI和CUDA的另一个不同之处在于MPI只有一级结

2013-01-22 16:36:21 2710

原创 Heterogeneous Parallel Programming(异构并行编程)学习笔记(六)

这里主要介绍CUDA的Overlapping计算。1. Pinned Memory所谓的Pinned Memory,是一种锁定内存物理地址的方法,对应于操作系统的分页技术。众所周知,操作系统的虚拟地址空间大于物理地址,通过分页(paging)技术来实现其转换与管理。如果在cudaMemcpy()过程中,正在发出或者接收数据的内存被paged out了,则对程序的性能肯定有影响。使用

2013-01-22 14:18:44 2863

原创 Heterogeneous Parallel Programming(异构并行编程)学习笔记(五)

这里主要讲述两种并行计算模式,前缀求和(Prefix Sum)以及卷积(Convolution)。1. Prefix Sum前缀求和由一个二元操作符和一个输入向量组成,虽然名字叫求和,但操作符不一定是加法。先解释一下,以加法为例:第一行是输入,第二行是对应的输出。可以看到,Output[1] = Input[0] + Input[1],而Output[length -

2013-01-09 17:14:59 2763

原创 Heterogeneous Parallel Programming(异构并行编程)学习笔记(四)

这次的内容主要集中在Reduction模型上。1. ReductionReduction是一种广泛使用的计算模型,特别是在并行计算领域。简单地来说,Reduction就是一系列的划分(Partition)和汇总(Summarize)操作的集合:对输入数据分块,对每一个分块汇总,然后再将汇总后的数据视为新的输入数据,重复分块和汇总,直到得到最终结果,可以想象为一个倒置的树。Googl

2013-01-07 15:43:45 2669

原创 Heterogeneous Parallel Programming(异构并行编程)学习笔记(三)

米国人都去过圣诞了,这次内容不多。1. Bursting由于种种原因,DRAM的核心速度低于接口速度,因此引入了所谓Bursting的技术。Bursting,是指当读取DRAM时,返回所读取的位以及其后连续的许多位,以增加访问速度。若其后的连续位没有被用到,则被丢弃。比如,DRAM的核心速度是接口速度的1/N倍,则在一次读取中,取出N × 接口位宽的数据,然后在N时间段中以接口速度

2012-12-23 19:26:25 3023 2

原创 Heterogeneous Parallel Programming(异构并行编程)学习笔记(二)

这里讲讲二维数据和内存模型1. 二维参数设置前面已经说过,CUDA支持多维的Grid和Block,以方便处理多维数据,那么在调用Kernel时函数也会有所不同。假定需要处理一张76x62像素的图片,采用16x16的Block,则参数设置如下:#define TILE_WIDTH 16dim3 dimBlock(TILE_WIDTH, TILE_WIDTH, 1);dim

2012-12-16 21:50:22 3051

原创 Heterogeneous Parallel Programming(异构并行编程)学习笔记(一)

好记性不如烂笔记。以下是在Coursera学习Heterogeneous Parallel Programming时记录的一些要点。Wiki对Heterogeneous Programming的解释如下:Heterogeneous computing systems refer to electronic systems that use a variety of differen

2012-12-13 22:29:58 7240 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除