GPU快速排序笔记

最新推荐文章于 2023-09-11 15:40:51 发布

G_fans

最新推荐文章于 2023-09-11 15:40:51 发布

阅读量3.7k

点赞数 1

分类专栏： Data Structures & Algorithm CUDA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niexiao2008/article/details/9622461

版权

CUDA 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

Data Structures & Algorithm

4 篇文章 0 订阅

订阅专栏

利用CUDA 5.0最新推出的 Dynamic Parallelism，以往很难使用的分治法现在可以轻易的在GK110上利用这一新特性实现，非常方便：

算法思想：

随机选取一个枢纽元（pivot），对排序数组进行划分，左边一组都比枢纽元小，右边一组都等于或大于枢纽元，然后对每一个分组递归使用快排算法直至每一个分组仅有一个元素，则排序完成。

示例图:

CUDA version with dynamic parallelism:

有了dynamic parallelism后，代码简洁清晰，nice!

Dynamic Parallelism的优势：

Programming the GPU will be easier than ever;
Algorithms previously considered difficult will now accelerate easily on GPUs;
The GPU depends significantly less on the CPU, enabling both to operate more efficiently.

参考：

1. http://blogs.nvidia.com/blog/2012/09/12/how-tesla-k20-speeds-up-quicksort-a-familiar-comp-sci-code/

2. cuda 5.5 sdk samples: cdpSimpleQuicksort

G_fans CSDN认证博客专家 CSDN认证企业博客

码龄18年

31: 原创

25万+: 周排名

199万+: 总排名

5万+: 访问

: 等级

846: 积分

18: 粉丝

8: 获赞

14: 评论

18: 收藏

私信

关注

热门文章

分类专栏

最新评论

SPH fluid simulation methods & source codes (cpu & gpu)
summer2day: 您好，我想问下代码里有cci文件，这是干嘛？为什么不写在cpp里
SPH fluid simulation methods & source codes (cpu & gpu)
Dchange: 小妹最近也在钻研这方面的东西，但是水平尚浅，知乎已留言，但是不知大神是否常看知乎，所以这里也留个言，读代码时有一点细节问题，还望不吝赐教，望答复，谢谢！
Physics-Based Animation learning notes
ljb1672: 1、在CSDN上难得找到对物理模拟深入的大神。想问句，博主的论文是关于SPH的？能否透露下内容供学习。 2、感觉刚体模拟的LCP方法比PBD（Position Based Dynamics）更复杂些。 3、咨询下，PDB模拟流体中，边界如何处理。Akinci的论文不是太理解。
SPH fluid simulation methods & source codes (cpu & gpu)
x532425411: 楼主，能加你的qq请教一下吗？
Physics-Based Animation learning notes
jiuyaoshuo: 为了multiple impacts买了PBA，可惜有点失望。就物理来看，LCP或者gap function基本扯谈（PBA上也有说），Gauss-Seidel问题很大（Ivanov A.P. On multiple impacts)，坚持刚体模型的话有一篇文章，用黎曼度量最小值来弄，不过就像文章中自己说，三体以上问题没办法证明解的唯一性。要是抛弃刚体模型的话，那也有很多麻烦，因为即使是经典的赫兹接触，线性理论也不适用，更不用说应力波的作用。有限元也是从为非光滑力学系统出发来做的，那就直接向量场不可微了。从correlation ratio出发也有好几篇文章，首先就说明牛顿摆这一模型未必是你想象得那样，不过总感觉给出correlation ratio方法的理论依据不足。也不知道是这个问题实在太难还是没人关注，找文章都有点困难，非光滑力学系统的有限元方法没试过，而且难度有点大，不知行不行，即使行，实时你也基本别想了。 P.S PBA里的碰撞检测算法说的v-clip这点有点坑，因为v-clip有专利，所以很多开源库都用GJK，不知道OpenTissue是不是在用v-clip，就不怕像当年卡马克一样被迫重写？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。