首先说,值得买,内容覆盖大规模语言模型的方方面面。我也买了,刚拿到手,过了一遍就给大家推荐一下。
原因其实很简单:写的真的是不错的。由浅及用!
这本书我觉得定位是从初学到中级的安排吧,因为没有太高深的东西,也没有见过什么书讲太难的(如果你觉得难,可能就是学不会,比如数学《普林斯顿数学指南》,只是个概述,我也只认识每一个汉字)。
另外就是这本书的内容还是很新鲜的,主要内容是 2022 年的技术吧。但是甚至于 2023 年上半年GPT4也有在行文中哦,这个对于 2023 年年底的书来讲,是非常难得的。
还是介绍一下内容吧。
- 大语言模型基础,这个没有什么好说的 Transformer 架构、 GPT 、 LLaMA,还有 FlashAttention, 所以有它你对于 Transformer 的基础会有一个非常不错的认知。
- 训练数据,单独拿出来一章讲,至少这个团队是干过从零到一的活的。
- 分布式训练,非常有意义,不过这一章也是有实际的例子的。
- 有监督微调(SFT)与强化学习,这也是工程实践非常好的指导。参考它至少不是像网上文章那样东拼西凑的东西,所以我真的建议所有做大模型相关工程或者有兴趣的人,都买本看看,如果不想买,它的电子版是公开在下面的地址的:
- 大语言模型应用,我觉得可能还可以再开拓一下,不过现阶段并没有出现 ChatGPT/GPT4 以外的特别让人眼前一亮的东西,对于一个偏实践与工程类的书,介绍各种产品应用的实现技术方向也是不错的。
- 大语言模型评估,也很好哦,有标准才有迭代。
总体上来讲我愿意以4.5/5 分的方式打分。
如果你不愿意买纸质书,下面的方式是有电子书在的!
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓