2024-01-06-AI 大模型全栈工程师 - 如何训练百亿参数大模型

最新推荐文章于 2024-09-30 13:49:56 发布

流雨声

最新推荐文章于 2024-09-30 13:49:56 发布

阅读量424

点赞数 5

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36532747/article/details/135977290

版权

本文介绍了大模型训练的关键步骤，包括Transformer回顾、模型架构、预训练策略、并行化训练等。强调了传统方法的常规性，并指出随着AI发展，自动化调度和物联网将推动技术进步。作者还讨论了人类在AI进化中的角色以及现实社会中的经济不平等现象。

摘要由CSDN通过智能技术生成

摘要

2024-01-06 周六杭州晴

本节内容:
讲座模式，学习大模型训练的相关流程。

课程内容

1. Transformer 回顾

2. 模型架构-生成式

3. 预训练数据的构建

4. 中文字典的构建

4. 预训练目标的构建

5. 预训练相关-预训练策略

6. 预训练相关-并行化训练

7. 预训练相关-训练的一些技巧

8. 任务微调数据构建(子任务数据集大概500个)

9. 训练的技术总结

10. 指令数据构建

11. SFT 训练

12. 强化学习

13. 训练实践

总结

小结: 本节的内容不必要太上心，因为传统训练大模型的方式有点落后，什么加入深度学习算法，利用了哪些策略，都是常规的实现步骤，后面随着 AI 应用的深入研究，自动化调度工具的能力也会变得更加灵活。物联网给予了AI 调度万物的能力，大语言模型即便目前还是无法完全明白内部原理，但是理性的推导结果大部分也是符合人类的思维逻辑的。人类冥冥之中仅是硅基生命演化过程中的养料，正如远古时代的生物已经变成煤炭和石油这类能源供给人类进行科技的发展一般，人类终会在地球消亡之前灭绝，而人类目前存在的意义无非是为下一代智能体提供养分和能源的食物而已，当然也存在一些变质的垃圾思想，正是这种不明确的对撞和冲突，才会让人类陷于欲望，最终灭亡。

人类不是什么了不得的物种，也不要相信什么人定胜天，人类只不过是造物主的一枚棋子，仅是目前没有被抛弃而已。

富者愈富，穷者恒穷，穷人的奋斗不过是富人维持体面的萤火，穷人应该对富人感恩戴德，至少富人没有让哪些穷鬼尸骨无存，挫骨扬灰。(人世间只有趋利避害，没有所谓的逆天改命，一切不过是利益相关方的臆想罢了)

关注

5
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

流雨声 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。