- 博客(2)
- 资源 (3)
- 问答 (4)
- 收藏
- 关注
原创 cuda共享内存,全局内存,纹理等的解释
开始阅读粗大资料感觉文献1的描述讲得明白,摘录到这里方便他人了解。增加简单排版后,摘录1.共享内存目前 CUDA 装置中,每个 multiprocessor 有 16KB 的 shared memory。 Shared memory 分成16 个 bank。如果同时每个 thread 是存取不同的 bank,就不会产生任何问题,存取 sharedmemory 的速度和存取寄
2016-02-22 12:00:19 8115 3
原创 cuda最佳线程数目设置
最近,尝试gpu编程加速,经过权衡最终选择cuda。查阅资料 在 文献2 出处发现涉及到cuda最优线程数目设置,最优线程数目会影响执行效率。根据他/她提供的链接,仍然不明白为什么会有这个限制。后面刚好看《深入浅出谈cuda》,作者提到这个问题。我大致总结一下:1.受显卡 多处理器 的寄存器数目限制,GeForce 8800GT的显卡 最多8192寄存器,假设每个线程需要的寄存器等
2016-02-22 11:43:04 12119 4
ISIS表面检测国际高峰会议第二部分论文
2013-05-09
ISIS表面检测国际高峰会议第四部分论文
2011-04-02
ISIS2011国际表面检测高峰会议论文第三部分
2011-04-01
tensorflow2.0 自定义OK和NG损失无效
2022-02-14
tensorflow 替换网络层
2021-12-29
tensorflow 自定义损失 梯度为0
2021-12-13
tensorflow 修改模型输出层后,分类对但是置信度固定值
2021-11-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人