推荐复旦的新书：《大规模语言模型从理论到实践》

泡椒竹笋面

已于 2024-05-09 20:57:15 修改

阅读量439

点赞数 4

文章标签：语言模型人工智能自然语言处理 pdf chatgpt AIGC

于 2024-04-19 15:31:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kaka0722ww/article/details/137966936

版权

首先说，值得买，内容覆盖大规模语言模型的方方面面。我也买了，刚拿到手，过了一遍就给大家推荐一下。

原因其实很简单：写的真的是不错的。由浅及用！

这本书我觉得定位是从初学到中级的安排吧，因为没有太高深的东西，也没有见过什么书讲太难的（如果你觉得难，可能就是学不会，比如数学《普林斯顿数学指南》，只是个概述，我也只认识每一个汉字）。

另外就是这本书的内容还是很新鲜的，主要内容是 2022 年的技术吧。但是甚至于 2023 年上半年GPT4也有在行文中哦，这个对于 2023 年年底的书来讲，是非常难得的。

还是介绍一下内容吧。

大语言模型基础，这个没有什么好说的 Transformer 架构、 GPT 、 LLaMA，还有 FlashAttention，所以有它你对于 Transformer 的基础会有一个非常不错的认知。
训练数据，单独拿出来一章讲，至少这个团队是干过从零到一的活的。
分布式训练，非常有意义，不过这一章也是有实际的例子的。
有监督微调(SFT)与强化学习，这也是工程实践非常好的指导。参考它至少不是像网上文章那样东拼西凑的东西，所以我真的建议所有做大模型相关工程或者有兴趣的人，都买本看看，如果不想买，它的电子版是公开在下面的地址的：
大语言模型应用，我觉得可能还可以再开拓一下，不过现阶段并没有出现 ChatGPT/GPT4 以外的特别让人眼前一亮的东西，对于一个偏实践与工程类的书，介绍各种产品应用的实现技术方向也是不错的。
大语言模型评估，也很好哦，有标准才有迭代。

总体上来讲我愿意以4.5/5 分的方式打分。

如果你不愿意买纸质书，下面的方式是有电子书在的！

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

泡椒竹笋面

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。