《实战AI大模型》是一本兼具深度和广度的大模型入门书籍,它深入浅出地诠释了AI大模型的核心概念和技术。以大模型为代表的AI2.0是有史以来最重要的技术革命,如果你渴望了解和应用大模型,这本书是一份可贵的“知识基座”-----李开复
无论你是NLP新手还是专家,《实战AI大模型》都值得一读。它涵盖了BERT和GPT等比较通用的模型,并提供了应用的案例,非常实用。比如,对于产业中应用大模型的人来说,《实战AI大模型》提供了丰富的信息。书中介绍了ChatGPT背后的模型在各种任务中的应用,对于想要深入了解这些模型的人来说,这本书是一个很好的起点。 -----360公司创始人、董事长兼CEO 周鸿祎
《实战AI大模型》详细介绍了从基本概念到实践技巧的诸多内容,全方位解读AI大模型,循序渐进、由浅入深。书中配有二维码视频,使读者身临其境,迅速、深入地掌握各种经验和技巧。本书还附带了丰富的额外资源:开源工具和库、数据集和模型案例研究和实际应用、在线交流社区等。读者可以综合利用这些资源,获得更丰富的学习体验,加速自己的学习和成长。
目录
第1章 深度学习中的AI大模型
- AI大模型在人工智能领域的兴起
- AI大模型的发展与挑战
- AI大模型为何难以训练
- 深度学习框架入门
- 搭建神经网络
- 训练一个文本分类器
第2章 分布式系统:AI大模型的诞生之所
- 深度学习与分布式系统
- 从分布式计算到分布式AI系统
- 大规模分布式训练平台的关键技术
- Colossal AI应用实践
- 大模型训练方法
- 梯度累积和梯度裁剪