自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_51152326的博客

深度学习底层机制探索

关注

文章平均质量分 87

关注数：文章数：1 文章阅读量：1382 文章收藏量：19

作者: Mocoacoa

少说多做

展开

[看完提高一个level]pytorch的batching训练机制——从GPU硬件的角度理解

现在我们就可以理解为什么在机器学习/深度学习中batching是一种非常常见的操作，因为只有单份的计算代码同时处理多份数据，基于SIMD的GPU的算术逻辑单元（ALU）才能被尽可能多地利用起来，才符合GPU的设计初衷——简单指令、超大数据量场景的并行化计算。同时，由于GPU的设计动机就是为了超大量的数据，故其基本假设就是：不管是使用再精妙的多级缓存结构还是更大的缓存单元，GPU核心也会频繁地发生cache miss，即需要频繁地从内存中更耗时地取数据，故其GPU上的缓存相对CPU较小。

原创 2024-07-20 18:26:51 · 1382 阅读 · 0 评论