【动手学深度学习】(十三)深度学习硬件

最新推荐文章于 2024-07-25 10:18:13 发布

释怀°Believe

最新推荐文章于 2024-07-25 10:18:13 发布

阅读量560

点赞数 10

分类专栏： # 动手学深度学习文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52986400/article/details/135000319

版权

动手学深度学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

文章目录

一、CPU和GPU
二、更多的芯片
三、单机多卡并行

一、CPU和GPU

在这里插入图片描述
提升CPU利用率

在计算a+b之前，需要准备数据
- 主内存->L3->L2->L1->寄存器(数据只有进入寄存器才可以参与运算)
提升空间和时间的内存本地性
- 时间：重要数据使得保持它们在缓存里
- 空间：按序读写数据使得可以预读取

GPU
在这里插入图片描述
CPU vs GPU

提升GPU利用率

并行
- 使用数千个线程
内存本地性
- 缓存更小，构建更加简单
少用控制语句
[总结]：
CPU:用于处理通用计算。性能优化考虑数据读写效率和多线程。
GPU：使用更小的核核更多的内存带宽，适合能大规模并行的计算任务。

二、更多的芯片

1.DSP:数字信号处理

在这里插入图片描述

2.可编程阵列(FPGA)

在这里插入图片描述

3.AI ASIC

在这里插入图片描述

三、单机多卡并行

一台机器可以安装多个GPU（1-16）
在训练和预测时，我们将一个小批量计算切分到多个GPU上来达到加速目的
常用切分方案有：
- 数据并行
- 模型并行
- 通道并行（数据+模型并行）

数据并行vs模型并行

数据并行：将小批量分成n块，每个GPU拿到完整参数计算一块数据的梯度
- 通常性能比更好
模型并行：将模型分成n块，每个GPU拿到一块模型计算它的前向和方向结果
- 通常用于模型大到单GPU放不下

释怀°Believe

关注

10
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
【动手学深度学习】(十三)深度学习硬件

硬件
复制链接

扫一扫

专栏目录

释怀°Believe CSDN认证博客专家 CSDN认证企业博客

码龄4年

140: 原创

2万+: 周排名

1万+: 总排名

7万+: 访问

: 等级

1562: 积分

838: 粉丝

210: 获赞

8: 评论

291: 收藏

私信

关注

热门文章

分类专栏

论文阅读 1篇
定位 2篇
AI 4篇
动手学深度学习 14篇
视觉SLAM 5篇
算法刷题 12篇
蓝桥杯题解 1篇
动态规划 3篇
其他 5篇
算法基础 22篇
C++ 2篇
Vue 11篇
微信小程序 4篇
开发-前端
CSS 7篇
JS 14篇
jQuery 4篇
BootStrap 1篇
Ajax 4篇
Node 8篇
数据可视化 2篇
JavaWeb 8篇
Linux学习笔记 2篇
软件测试 2篇

最新评论

【论文阅读】PointNetVLAD: Deep Point Cloud Based Retrieval for Large-Scale Place Recognition
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】Global visual localization in LiDAR-maps through shared 2D-3D embedding space（2020-ICRA）
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【动手学深度学习】(十四)数据增广+微调
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【动手学深度学习】(七)丢弃法
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/617671692。
动态规划进阶
CSDN-Ada助手: 非常棒的一篇博客，“动态规划进阶”，感谢你的分享！相信你一定有更深入的研究和探索，期待您能分享更多关于动态规划的技术文章。不妨考虑写一篇关于“利用动态规划求解路径问题”的博客，介绍如何针对各种不同的路径问题，利用动态规划算法进行求解。期待您的精彩分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

释怀°Believe 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。