自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

是云就要飞的博客

友人小A CSDN认证博客专家 CSDN认证企业博客

码龄8年

42: 原创

30万+: 周排名

6万+: 总排名

8万+: 访问

: 等级

836: 积分

97: 粉丝

133: 获赞

13: 评论

238: 收藏

私信

关注

热门文章

分类专栏

笔记 10篇
分布式 3篇
刷题 6篇
深度学习 6篇
C++ 3篇
Python 6篇
libtorch 1篇
Pytorch 4篇
TensorFlow 9篇
caffe 2篇
测试 1篇
问题记录 5篇

最新评论

AIGC-Stable Diffusion发展及原理总结
友人小A: 以前我的浏览数据都很少的，但是最近每次发布博客，间隔固定时间会有点赞和收藏，现象异常，且这些人都是通过“博客”点赞收藏的。
AIGC-Stable Diffusion发展及原理总结
西街暖阳: 怎么看出来是不是机器人的呢？
AIGC-Stable Diffusion发展及原理总结
友人小A: 终于有活人看了，开心死了谁懂啊（最近都是机器人刷数据）！
AIGC-Stable Diffusion发展及原理总结
西街暖阳: 真的很详细，我自己一开始去看文献晕晕乎乎的，看了之后好很多，谢谢博主
Deepspeed Zero(DP)
友人小A: G_1表示完整梯度的1/3, 反向计算时通过all-gather得到的完整weight和grad_out, 计算得到 sub_batch1对应的梯度G1，然后对G1,G2,G3做reduce, 每张卡上的梯度都同步后，单张卡上只保留一部分grad, 就是G_1, G_2, G-3

最新文章

深度学习

关注

文章平均质量分 86

关注数：文章数：6 文章阅读量：9634 文章收藏量：85

作者: 友人小A

四级社畜

展开