自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 cuda 笔记 2

上一节写的简单的部分已经可以足够我们去写一些程序了,但是只有一个问题,就是效率。在书上,关于程序的书写规范似乎那一章就大部分都说了,后面的部分翻了翻全是在讲效率问题,而我之前就是在紧接的一章中没有看完就放弃了,日常半途而废。这一章(6章)讲的主要是gpu中的各式存储问题,存储器的速度和带宽也是gpu运行程序中的瓶颈,他们的速度可以大致列为寄存器>共享内存>全局内存。甚至说,这一句话...

2019-03-22 15:13:16 141

原创 cuda笔记 1 基本单元

对于gpu并行编程来说,我们第一需要了解的就是流处理器sm,线程块之间的关系,他们基本上决定了并行调度的过程。而具体参数可以参考书上的图。总结来说,在2.x及之前的架构中,一个sm最多容纳8个线程块,而最多容纳的线程数为1536,因此一个线程块的最大线程数为1024,这是最极端的情况,只能容纳一个线程块。这个而对于一般的情况来说,一个线程块的线程数至少在192以上才能发挥出gpu足够的性能,1...

2019-03-20 13:25:56 328

原创 optix获取交点的模型id

最近遇到了怎样获取交点对应模型的问题。方法参考了nvida网站的帖子,因为我们对每个geomrtry都定义了其intersection program, 而求交点的过程就是在这个program中发生的,所有的顶点数组、三角形索引数组等都是传到这里面的,因此我们对交点的模型ID识别也需要在这里定义。只需要创建geometry时多传进来1个ID的参数,代表模型的ID信息,就能够获取到了。然后用...

2018-12-26 11:58:42 324

原创 二十年不抽烟买保时捷问题

今天看段子又看到这个段子了,但是这次多想了一下,发现这个问题与半杯水问题是差不多的,无非是半空还是半满。二十年抽烟到底能花多少钱呢?按照每天一根烟,一根烟1-2元来计算,其实也就1w元以内而已,距离保时捷相差远了。就算烟瘾大的人也多不了多少,对于一般的家庭来说,可能也就几个月的收入。但是如果能利用这份收入去赚钱,那么似乎经历二十年是有可能完成巨大涨幅甚至买保时捷的;相对的,就算你不抽烟,这1w...

2018-12-11 15:17:56 657

原创 sizeof的小结

关于sizeof的作用我总是给弄混,在此做个小结sizeof(type) 这种情况下输出的就是type类型的字节数,至少是按byte对齐的sizeof + 数组 输出的是sizeof(type)*数组的容量,而非数组的容量,这点我总是搞混,在此记录一下。...

2018-12-05 10:01:46 108

原创 optix的map及unmap

众所周知,在optix当中的buffer如果需要读取数据,那么要么用通过pbo的方式用opengl转出来,要不就是map和unmap的操作。如buffer->map(),其中也可夹带参数表明只读或只写等控制。那么,能否直接利用map后传回来的指针呢,答案是不行的。buffer传回来的指针只在map和unmap之间的区域才有效,unmap过后就相当于把数据回收回去了,如果想要存下来还需要单...

2018-12-04 21:50:48 1032

原创 建立一个新的optix工程及其他

首先,本文的基础配置参考了新的optix一文,但是依然遇到了巨多问题,截至现在才算基本弄清楚了边边角角。推荐先不要把以上信息配置完,而是优先配置其他的部分,以免两边的配置混在一起完全无法找到原因所在。理论上来说,比着sample中的一个简单样例配置完成后完全不需要配置cuda即可运行,cuda的配置是为了生成ptx文件的。比着sample中的配置配成功后,再按照上文中所提到的cuda有关的...

2018-12-02 20:13:08 464 1

原创 向已有项目配置cuda

关于如何向已有项目配置cuda的问题在网上已有非常多的解答,基本上就是如何生成自定义,配置目录及链接器输入lib等。因此,在这里只说一下之后的一些问题,首先配置完所有lib以后是无法运行的,因为缺少dll。因此需要从cuda的安装目录中把一些dll拷贝过来,其中包括cannot load builtins 等错误。到现在所有的编译运行都应该没有问题了。另外,如果想使用cuda样例中的代码,...

2018-11-14 11:03:14 296 1

原创 热点笔试题:经过多少次消除才能将序列变为单调递增/递减序列

 最近一道笔试题非常火热,大意即是经过多次操作,每次都消除连续递减部分,问经过多少次才能令数组变为递增的,即无法操作。思路比较简洁:造出一颗消除树,每个节点的子节点就是最后会被这个节点消除的位置。最后的答案就是这棵树的最大深度。但是需要一些思维及编程技巧,第二次遇到这道题就决定把该题答案写出来了。代码如下 #include <iostream>using namespa...

2018-09-07 21:42:39 1106

原创 第一次发博,《染色法与构造法在棋盘上的应用》的理解

看了太多大神的文章,被吓的半句话也不敢乱说,然后看了很多很多人教育我说要学会写博客,而我一直都觉得自己弱成渣,分分钟被秒成狗,然而我还是来了,因为尽管我弱,而你,却无可奈何。 废话不多说,第一次就不发别人发过的题解了,别人没发过的不用说,我肯定不会做。。。 就发个对于方奇论文《染色法与构造法在棋盘上的应用》的理解吧。简单的就不抄了。(表示自己经常看不懂他们的论文,逃) ...

2015-09-28 23:24:14 1145

GO学习笔记

go学习笔记go学习笔记go学习笔记go学习笔记go学习笔记go学习笔记

2018-08-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除