近日,人工智能领域的大牛 Andrej Karpathy 在 GitHub 上开源了他的最新力作——LLM101n,一个教你从零开始构建“故事大王”AI大语言模型的项目,再次引爆了技术圈。Karpathy 雄心勃勃,试图打造一门类似于其经典课程 cs231n 的完整课程,手把手带你构建 ChatGPT 级别的人工智能模型。
项目目标:打造会讲故事的 AI
LLM101n 项目的目标是构建一个能够创作、提炼和阐释小故事的大语言模型,并将其命名为“Storyteller”。不同于市面上现有的 AI 模型,Karpathy 希望通过 LLM101n,让用户能够与 AI 共同创作,体验 AI 讲故事的乐趣。
项目特色:从基础到实战,一网打尽
LLM101n 项目最大的特色在于其系统性和完整性。该项目涵盖了从语言建模、机器学习的基础知识,到多模态、强化学习、模型部署等多个方面,力求为学习者提供一个全面的学习路径。
课程大纲:
以下是 LLM101n 项目的课程大纲:
基础篇:
- 第一章:Bigram 语言模型:介绍语言建模的基础知识,以及如何构建一个简单的