《GPU高性能运算之CUDA》我们的书总算出来了

46 篇文章 0 订阅
38 篇文章 0 订阅

未标题-3

http://www.dearbook.com.cn/book/255585

http://www.china-pub.com/48582&ref=ps

http://product.dangdang.com/product.aspx?product_id=20705176

http://product.dangdang.com/product.aspx?product_id=20705187

http://www.amazon.cn/mn/detailApp/ref=sr_1_1?_encoding=UTF8&s=books&qid=1257088907&asin=B002U848C6&sr=1-1

历时应该有一年多时间,从最开始组织吆喝一群朋友帮忙写书,到中途一些事情的变故,再到后来张舒和艳利同学的不懈努力,终于经历一年多的时间把这本书完成了。

张舒和艳利在书的编写中作出的不懈努力值得我好好学习。张钰博同学已经去了UC 戴维斯 读博士,非常感谢晓炜同学那天能收留我在他们宿舍过夜,也是在那天晚上和张钰博同学聊到了CPU加速,聊到了GPU加速,聊到了CUDA,也才有了最终的这本书。很感谢张钰博同学能带我进入GPU的世界,也是沾了浙大的光……

对于这本书,对晓炜同学深表歉意,对boss来说也深表歉意。

这一年的光影仿佛历历在目,百感交集,有好多话想讲,却不知道从哪里开始。

生活,学习,工作……

继往开来,步步为营,踏踏实实,是对自己的督促,也是给朋友们的勉励。

CUDA让我结识了很多朋友,从全国的巡讲:

广州 (2009年3月28日,星期六) 华南理工大学 A4204/学术报告厅(圆满结束)
成都 (2009年4月11日,星期六) 电子科技大学 清水河基础教学楼B213(圆满结束)
武汉 (2009年4月23日,星期四) 华中科技大学 华中科技大学一号楼报告厅(圆满结束)
武汉 (2009年4月21日,星期二) 武汉大学 武汉大学莱卡厅(圆满结束)
合肥 (2009年4月25日,星期六) 合肥工业大学 南校区学术报告厅一楼大厅(圆满结束)
合肥 (2009年4月27日,星期一) 中国科技大学 西区活动中心学术报告厅(圆满结束)

到中科院的GPU研讨会:

再到Nvidia的GTC全球研讨会;

查看自己Email收发的CUDA相关的问题,超过几千封~回答过不止上千个的问题……

很感谢CSDN能给我提供这样的平台,也很感谢Nvidia的,邓老师,魏鸣,谢强,还有很多帮助过我的朋友,由衷的感谢……

中科院的葛蔚老师,张云泉老师,王龙博士,万宁博士,张先轶同学,陈实同学,刘伟峰...还有很多中科交流的时候认识的老师,同学……

清华的邓仰东老师……

还要感谢浪潮公司能给我和很多公司企业交流的机会,感谢王总,刘总对我的支持,还有team里面的兄弟的支持……;

在GTC遇到的联想的中国和俄罗斯大区的VP,魏总,也是我北理工的师兄,对我的鼓励,还有史博士,真的好感激……

吉星吉达的佟小龙……

全国各地好多的老师,同学,朋友……

还有国外的朋友……

还有找我写作业的国外的同学……让我知道了,不只是有国内的同学有找别人帮忙写作业的情况,其实全世界都有~~只是多少问题……

还有台湾国立中正大学电机所得 陈永维 同学,到香港来旅游的时候,还送我一盒月饼,真的好感谢……

还有参加GTC的时候送书给我的Steve Worley,虽然我知道他看不懂中文……

还有这一年来一直陪在我身边的朋友……

由于CUDA,我认识了好多好多的朋友,非常感谢,是你们的鼓励和支持,才让我感觉到了温暖……谢谢!

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 13
    评论
GPU高性能计算之CUDA》实例。 GPU高性能计算系列丛的第一本《GPU高性能计算之CUDA》已经出版,由张舒,褚艳利,赵开勇,张钰勃所编写。本除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外,还包含有大量的实例供读者学习参考用。 下表是各个实例的介绍列表。 文件夹 对应中章节 备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法,CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法,利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法,利用register reduction 4.7.2 并行归约(缩减)程序 scan 5.1.2 Scan算法,例如计算前缀和 scanLargeArray 5.1.2 Scan算法,可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用,驱动API 实现 sortingNetworks 5.1.1 双调排序网络,处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置,考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加,驱动API实现 【备注】以上工程,均在Windows XP 64-bit + Tesla C1060 + CUDA 2.3 + VS2005环境下测试通过。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值