GPU vs CPU，GPU的三大优势

一只懂AI的喵

已于 2024-05-15 17:07:21 修改

阅读量1.4k

点赞数 19

文章标签： gpu算力

于 2024-05-14 20:43:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53795212/article/details/138869446

版权

1、CPU是针对延迟优化的，而GPU是针对带宽优化的。

你可以将CPU想象为一辆法拉利，而GPU则是一辆大卡车。它们的任务都是从一个随机位置A取得包裹，并将这些包裹运送到另一个随机位置B。CPU（法拉利）可以快速从你的RAM中获取一些内存（包裹），而 GPU（大卡车）在这方面做得较慢（延迟更高）。然而，CPU（法拉利）需要多次往返才能完成任务（从位置A取2个包裹到位置B...重复），而GPU可以一次性获取更多的内存（从位置A取100个包裹到位置B...重复）。

换句话说，CPU擅长快速获取少量内存（例如5 * 3 * 7的运算），而GPU擅长获取大量内存（例如矩阵乘法：(A*B)*C）。最好的CPU具有大约50GB/s的内存带宽，而最好的GPU有750GB/s的内存带宽。因此，你的计算操作需要的内存越多，GPU相对于CPU的优势就越明显。

2、隐藏线程并行下的内存访问延迟

GPU的延迟问题可能会影响性能。一辆大卡车虽然可以一次携带很多包裹，但问题在于你需要等很长时间才能收到下一批包裹。如果不解决这个问题，即使是处理大量数据，GPU也会非常慢。那么这个问题是如何解决的呢？

如果你要求一辆大卡车进行多次运输包裹，你总是需要等待很长时间，直到卡车完成下一次运输——卡车本来就慢。然而，如果你现在使用一队法拉利和大卡车（线程并行性），并且有一个包含许多包裹的大型任务（如大块内存

最低0.47元/天解锁文章

一只懂AI的喵

博客等级

码龄4年

44
原创

755
点赞

801
收藏

567
粉丝

关注

私信

热门文章

最新评论

VIKOR方法
m0_70402254: 计算每个手机的S和R值那块是不是有问题
Ollama+Open WebUI本地部署Llama3 8b（附踩坑细节）
take.action: 我这里使用容器docker下载open-webui特别慢，已经测试了很多镜像源，选择了能访问且最快的镜像，可依旧几kb,5分钟才几乎下载完1M，他这有个990多M和300多M的，得下载好几天了，代理又没有，难搞
Ollama+Open WebUI本地部署Llama3 8b（附踩坑细节）
qq_43312672: WARNI [langchain_community.utils. user_agent] USER_AGENT environment variable not set, consider setting it to identify your requests.
大语言模型知识点分享
可我什么都不会啊: 请问GLM4还是prefix吗
Ollama+Open WebUI本地部署Llama3 8b（附踩坑细节）
火柴人MG: 改了模型地址后，再次ollama run llama3.2 还是会再次下载模型。感觉识别不到我下载的哪个

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。