推荐复旦的新书:《大规模语言模型 从理论到实践》

首先说,值得买,内容覆盖大规模语言模型的方方面面。我也买了,刚拿到手,过了一遍就给大家推荐一下。

原因其实很简单:写的真的是不错的。由浅及用!

img

这本书我觉得定位是从初学到中级的安排吧,因为没有太高深的东西,也没有见过什么书讲太难的(如果你觉得难,可能就是学不会,比如数学《普林斯顿数学指南》,只是个概述,我也只认识每一个汉字)。

另外就是这本书的内容还是很新鲜的,主要内容是 2022 年的技术吧。但是甚至于 2023 年上半年GPT4也有在行文中哦,这个对于 2023 年年底的书来讲,是非常难得的。

还是介绍一下内容吧。

  • 大语言模型基础,这个没有什么好说的 Transformer 架构、 GPT 、 LLaMA,还有 FlashAttention, 所以有它你对于 Transformer 的基础会有一个非常不错的认知。
  • 训练数据,单独拿出来一章讲,至少这个团队是干过从零到一的活的。
  • 分布式训练,非常有意义,不过这一章也是有实际的例子的。
  • 有监督微调(SFT)与强化学习,这也是工程实践非常好的指导。参考它至少不是像网上文章那样东拼西凑的东西,所以我真的建议所有做大模型相关工程或者有兴趣的人,都买本看看,如果不想买,它的电子版是公开在下面的地址的:
  • 大语言模型应用,我觉得可能还可以再开拓一下,不过现阶段并没有出现 ChatGPT/GPT4 以外的特别让人眼前一亮的东西,对于一个偏实践与工程类的书,介绍各种产品应用的实现技术方向也是不错的。
  • 大语言模型评估,也很好哦,有标准才有迭代。

总体上来讲我愿意以4.5/5 分的方式打分。

如果你不愿意买纸质书,下面的方式是有电子书在的!

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值