MoE结构梳理

weixin_44184816

已于 2024-08-28 22:39:10 修改

阅读量689

点赞数 21

文章标签：算法自然语言处理

于 2024-08-28 22:31:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44184816/article/details/141651420

版权

资源0：传统ffn

一张图说清楚：大模型“大”在哪？ChatGLM模型结构详解-CSDN博客https://blog.csdn.net/xian0710830114/article/details/138386170?ops_request_misc=&request_id=&biz_id=102&utm_term=ffn%20mlp&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-5-138386170.142%5Ev100%5Epc_search_result_base6&spm=1018.2226.3001.4187

资源1：Mindspore

第二十课：MoE_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1jH4y177DL/?spm_id_from=333.337.search-card.all.click&vd_source=de16465aaf1f2b33a8c4f5b96fad18d7

mixtral的moe结构

资源2：zomi

大模型算法有哪种结构？怎么样才算大模型呢？从Transformer和MOE结构看大模型发展！【分布式算法】系列第02篇_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1Mt4y1M7SE/?spm_id_from=333.999.0.0&vd_source=de16465aaf1f2b33a8c4f5b96fad18d7

知乎文章：

Megatron-LM中MOE并行分组策略 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/696389676

图解大模型训练系列之：DeepSpeed-Megatron MoE并行训练（原理篇） - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/681154742

图解大模型训练系列之：DeepSpeed-Megatron MoE并行训练（原理篇） - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AIhttps://www.53ai.com/news/qianyanjishu/1642.html

图解大模型训练系列之：DeepSpeed-Megatron MoE并行训练（源码解读篇） - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/681692152

论文解读

swith-transformer

weixin_44184816

关注

21
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

weixin_44184816 CSDN认证博客专家 CSDN认证企业博客

码龄6年

6: 原创

22万+: 周排名

9万+: 总排名

5491: 访问

: 等级

175: 积分

82: 粉丝

112: 获赞

1: 评论

116: 收藏

私信

关注

热门文章

最新评论

NLP八股
CSDN-Ada助手: 恭喜您开始了博客创作的第一步！标题“NLP八股”听起来非常有趣，期待能够看到您对NLP这个领域的深入探讨和独到见解。建议在接下来的创作中，可以尝试结合实际案例或者个人经验，让读者更容易理解和接受您的内容。祝您在博客写作的道路上越走越远，不断进步！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。