在GPU上训练ANN的优化方法

最新推荐文章于 2024-03-31 00:24:23 发布

huaweimember

最新推荐文章于 2024-03-31 00:24:23 发布

阅读量2.1k

点赞数

分类专栏：机器学习文章标签：机器学习分布式嵌入式系统 AWS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huaweimember/article/details/19217665

版权

《Distributed Neural Networks with GPUs in the AWS Cloud》

原文链接：http://techblog.netflix.com

这篇文章应该是Netflix对利用AWS进行ANN分布式训练的一个介绍，虽然主题是ANN，但大部分内容主要是在讲如何对模型进行分解以适应分布式的训练，和如何优化计算以缩短训练时间，感觉适用于很多分布式应用，而不仅限于ANN的训练。

文中提到Ng 仅用了3台机器用了几天时间就完成了大规模的模型训练，并且其规模是猫脸模型的6.5倍。猫脸模型就是大名鼎鼎的google大脑，当时是用了1000台共16000个核的计算机。这个提升是怎么做到的？其中一点原因是从CPU升级到了GPU ，其他原因文中没有明确说明。个人认为还有一个可能是：猫脸模型是首个最接近人脑模型，刚开始估计以功能为主，没有作过太多优化，这也给后续的提升留了大量空间。

分布式训练的三个层次

文中将模型训练过程分解为三个层次，在这三个层次上进行分布式训练：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。