实际工作中的高级技术（训练加速、推理加速、深度学习自适应、对抗神经网络）

Billie使劲学

已于 2023-08-11 10:02:15 修改

阅读量1.6k

点赞数 9

CC 4.0 BY-SA版权

分类专栏：机器学习深度学习 Pytorch基础知识学习文章标签：深度学习神经网络人工智能

于 2022-08-03 20:08:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_45447650/article/details/126034670

Pytorch基础知识学习同时被 3 个专栏收录

18 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

32 篇文章

订阅专栏

15 篇文章

订阅专栏

本文详细探讨了深度学习的训练加速和推理加速技术，包括基于数据和模型的并行策略，如Model Average、SSGD和ASGD。在推理优化方面，介绍了SVD分解、Hidden Node prune、知识蒸馏、参数共享和神经网络量化等方法，旨在减小模型大小和提高推理速度。同时，文章还讨论了深度学习的自适应策略，如网络迁移和数据混合，以适应不同场景需求。

目录

一、训练加速

1.基于数据的并行

①Model Average（模型平均）

②SSGD（同步随机梯度下降）

③ASGD*（异步随机梯度下降）

2.基于模型的并行

二、推理加速

2.Hidden Node prune

3.知识蒸馏*

5.神经网络的量化*

7.基于fft的循环矩阵加速

三、深度学习自适应

1.初始参数的网络迁移

2.场景自适应（KLD）

3.数据的混合

四、对抗神经网络

一、训练加速

针对训练数据过于庞大的对策，多GPU训练，加速生产模型的速度，可以认为是离线操作。

常用的GPU训练：

基于数据的并行（常用）
基于模型的并行

我们主要看一下基于数据的并行，下面列出了三种并行方式

①Model Average（模型平均）

②SSGD（同步随机梯度下降）

③ASGD*（异步随机梯度下降）

1.基于数据的并行

①Model Average（模型平均）

假设有10000条数据，分成10份，每份1000条，用十个GPU分别训练，最后将得到的模型进行平均。这样训练出来的模型之间是相互独立的，故性能不会很好。

了解本专栏

超级会员免费看

11 条评论

Hitsuzen_maker 2022.10.28
这是什么视频课程啊大佬
- Billie使劲学回复Hitsuzen_maker 2022.11.01
  深度之眼的AI课程

Drw_Dcm 2022.08.04
写的非常详细，适合新手学习

Baker-Chen 2022.08.04
博主写的太详细了，内容知识点也很丰富，讲解的也很清晰，通俗易懂，必须关注加三连支持

我是一棵卷心菜 2022.08.04
这篇文章写的真好，认真看完收获很大，感谢分享

阿提说说 2022.08.04
实战好文，好详细，好多内容，学习了，期待回访置顶文章

有缘再见了 2022.08.04
支持一波大佬

includeevey 2022.08.04
好文，三连

一一哥Sun 2022.08.04
满满的干货，解决了我的大问题，必须来个三连支持一下

评论 11

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Billie使劲学 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。