最新《开源大模型食用指南》已发布，速通LLM大模型（文档分享）

程序员羊羊

于 2024-07-17 10:22:17 发布

阅读量639

点赞数 8

文章标签：人工智能深度学习 transformer chatgpt 语言模型

本文链接：https://blog.csdn.net/chengxuyuanyy/article/details/140487448

版权

前言

《开源大模型食用指南》 是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导，简化开源大模型的部署、使用和应用流程，让更多的普通学生、研究者更好地使用开源大模型，帮助开源、自由的大模型更快融入到普通学习者的生活中。 项目的主要内容包括：

基于 AutoDL 平台（可扩展，例如阿里云）的开源 LLM 环境配置指南，针对不同模型要求提供不同的详细环境配置步骤；
针对国内外主流开源 LLM 的部署使用教程，包括 InternLM、Qwen、ChatGLM、DeepSeek 等；
开源 LLM 的部署应用指导，包括命令行调用、在线 Demo 部署、LangChain 框架集成等；
开源 LLM 的全量微调、高效微调方法，包括分布式全量微调、LoRA、ptuning 等。

图1.项目主页

开源初心

什么是大模型？

大模型（LLM）狭义上指基于深度学习算法进行训练的自然语言处理（NLP）模型，主要应用于自然语言理解和生成等领域，广义上还包括机器视觉（CV）大模型、多模态大模型和科学计算大模型等。

百模大战正值火热，开源LLM层出不穷。如今国内外已经涌现了众多优秀开源 LLM，国外如 LLaMA、Alpaca，国内如 ChatGLM、BaiChuan、InternLM（书生·浦语）等。开源 LLM 支持用户本地部署、私域微调，每一个人都可以在开源 LLM 的基础上打造专属于自己的独特大模型。

然而，当前普通学生和用户想要使用这些大模型，需要具备一定的技术能力，才能完成模型的部署和使用。对于层出不穷又各有特色的开源 LLM，想要快速掌握一个开源 LLM 的应用方法，是一项比较有挑战的任务。

本项目旨在首先基于核心贡献者的经验，实现国内外主流开源 LLM 的部署、使用与微调教程；在实现主流 LLM 的相关部分之后，我们希望充分聚集共创者，一起丰富这个开源 LLM 的世界，打造更多、更全面特色 LLM 的教程。星火点点，汇聚成海。

我们希望成为 LLM 与普罗大众的阶梯，以自由、平等的开源精神，拥抱更恢弘而辽阔的 LLM 世界。

项目受众

本项目适合以下学习者：

想要使用或体验LLM，但无条件获得或使用相关 API；
希望长期、低成本、大量应用LLM；
对开源LLM感兴趣，想要亲自上手开源 LLM；
NLP在学，希望进一步学习LLM；
希望结合开源LLM，打造领域特色的私域 LLM；
以及最广大、最普通的学生群体。

项目规划及进展

本项目拟围绕开源 LLM 应用全流程组织，包括环境配置及使用、部署应用、微调等，每个部分覆盖主流及特点开源 LLM：

图2.已支持的模型

学习指南

本教程出发点便是降低大模型部署开发的学习门槛，帮助更多初学者入门大模型开发领域， 因此本教程的受众是所有具备基础 Python 能力，想要掌握大模型应用开发部署技能的开发者。也就是说，本项目对学习者的人工智能基础、算法基础没有任何要求，仅需要掌握基本 Python 语法、掌握初级 Python 开发技能即可 。学习者可以任意挑选一个模型进行学习，每个教程都是相对独立的教程。

理论上7小时就可以将本项目的所有教程全部跑通一遍（除全量微调外），一杯奶茶速通大模型，掌握开源大模型部署的核心科技。

文章最后

为什么要做这样一个开源项目？我自己也是一名学习者，在暑假期间参加了 Datawhale 组织的夏令营学习活动，并作为专业助教为学习者解答疑惑。做助教期间帮助了很多学习者，也感受到了学习者关于大模型参差不齐的水平，很多我看来很简单的入门的知识，初学者也需要很长时间来理解（如果没有合适的引导）。所以我和我的小伙伴决心做一个让更多的普通学生、研究者更好地使用开源大模型，帮助开源、自由的大模型更快融入到普通学习者的生活中的项目，因此《开源大模型食用指南》诞生了。

最后，由于贡献者团队时间仓促、精力有限，教程难免有些疏漏甚至错误，我们期望学习者在学习的同时，也能积极给我们建议，或者直接对项目进行贡献，让我们共同打磨教程，为后面的学习者提供更好的内容。

一、大模型全套的学习路线

学习大型人工智能模型，如GPT-3、BERT或任何其他先进的神经网络模型，需要系统的方法和持续的努力。既然要系统的学习大模型，那么学习路线是必不可少的，下面的这份路线能帮助你快速梳理知识，形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别：AI大模型API应用开发工程

L3级别：大模型应用架构进阶实践

L4级别：大模型微调与私有化部署

一般掌握到第四个级别，市场上大多数岗位都是可以胜任，但要还不是天花板，天花板级别要求更加严格，对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线，不知道为什么发出来就有点糊，高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

程序员羊羊

关注

8
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
最新《开源大模型食用指南》已发布，速通LLM大模型（文档分享）

为什么要做这样一个开源项目？我自己也是一名学习者，在暑假期间参加了 Datawhale 组织的夏令营学习活动，并作为专业助教为学习者解答疑惑。做助教期间帮助了很多学习者，也感受到了学习者关于大模型参差不齐的水平，很多我看来很简单的入门的知识，初学者也需要很长时间来理解（如果没有合适的引导）。所以我和我的小伙伴决心做一个让更多的普通学生、研究者更好地使用开源大模型，帮助开源、自由的大模型更快融入到普通学习者的生活中的项目，因此《开源大模型食用指南》诞生了。
复制链接

扫一扫