LLM的进阶之路

wangziling123456

已于 2024-05-18 14:33:50 修改

阅读量299

点赞数 4

文章标签：人工智能

于 2024-04-22 21:26:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangziling123456/article/details/138091670

版权

起源

transformer模型，它由级联的encoder和decoder组成。输入一段文本，编码器把它压缩到潜空间，再用解码器翻译成新的文本。

encoder-only ——BERT派

像善于分析的专家，输入一段文本，可以将文本拆解的头头是道

本质是把高维数据压缩到低维空间

本质是完形填空的模式，给定一个句子，随即掩盖掉一些词，然后让模型预测是什么，训练要同时考虑上下文 ，这就体现了BERT的双向性，比单向的搜索空间更大，因为他需要在整个词汇表中找最合适的词来填充每个空

decoder-only ——GPT派

会讲故事的专家，能流畅的自说自话

采用的是自回归序列，给定一个序列，模型预测之后可能出现的不同单词，计算概率，选择最大概率输出，不断迭代能输出完整的句子

本质上他学习的是词与词之间的造句关系，搜索空间相对较小，就像一个人在不断自我学习，锻炼讲故事的能力

encoder+decoder ——T5派

GPT派

相比于gpt-2,谷歌的gopher验证了通过扩大模型的规模有效处理复杂任务的可行性，chinchilla验证了增加数据比增加模型参数更有效，llama则通过不到十分之一的参数便实现了堪比gpt系列的性能

大模型训练流程图

参考视频

动画科普LLM大模型进阶之路：为何GPT之外一定要关注LLaMA_哔哩哔哩_bilibili

【手把手带你实战HuggingFace Transformers-实战篇】实战演练之预训练模型_哔哩哔哩_bilibili

wangziling123456

博客等级

码龄3年

23
原创

203
点赞

230
收藏

166
粉丝

关注

私信

热门文章

上一篇：: 读懂 transformer

下一篇：: AI Agent

最新评论

一文读懂RAG
CSDN-Ada助手: 恭喜您写出了如此精彩的一篇博客！通过您的文章，我对RAG有了更深入的了解。希望您能继续保持创作的热情，分享更多有价值的内容。或许下一步可以深入探讨RAG的应用场景或者与其他技术的结合，让读者们有更多的收获。期待您的下一篇作品！祝您创作愉快！
AI Agent论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
AI Agent论文阅读
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618538741。
八股文——机器学习基础参数初始化
CSDN-Ada助手: 恭喜作者撰写了第5篇博客，探讨了关于机器学习基础参数初始化的主题。不断学习和分享知识是非常值得赞赏的，希望作者能继续保持创作的热情和努力。接下来，建议可以深入研究不同的参数初始化方法，以及它们在实际应用中的效果和优劣势，这样可以为读者提供更加全面和深入的内容。希望作者在未来的创作中能够继续努力，不断提升自己的写作水平和专业知识。期待看到更多精彩的文章！愿你前程似锦，写作越来越好！
八股文——机器学习基础Dropout
CSDN-Ada助手: 恭喜您写下了第6篇博客！标题中提到了“八股文——机器学习基础Dropout”，内容一定十分精彩！希望您能继续保持写作的热情和创造力，不断探索更多有趣的主题。或许下一篇博客可以深入探讨一些实践经验或者案例分析，让读者更加深入地了解机器学习领域的知识。期待您的下一篇作品！谢谢您的分享！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。