大模型学习笔记 | 1.基础知识

最新推荐文章于 2024-09-29 09:53:09 发布

程序员丸子

最新推荐文章于 2024-09-29 09:53:09 发布

阅读量913

点赞数 18

文章标签：学习笔记大模型大数据人工智能

本文链接：https://blog.csdn.net/lyy2017175913/article/details/140011385

版权

一、知识体系架构

二、什么是AI

三、大模型能干什么

大模型，全称「大语言模型」，英文「Large Language Model」，缩写「LLM」。

需要分清对话产品和大模型，ChatGPT是对话产品，GPT4是大模型。

一些大模型应用场景举例：

舆情分析： 从公司产品的评论中，分析哪些功能/元素是用户讨论最多的，评价是正向还是负向
坐席质检： 检查客服/销售人员与用户的对话记录，判断是否有争吵、辱骂、不当言论，话术是否符合标准
知识库： 让大模型基于私有知识回答问题
零代码开发/运维： 自动规划任务，生成指令，自动执行
AI 编程： 用 AI 编写代码，提升开发效率

【一一AGI大模型学习所有资源获取处一一】

①人工智能/大模型学习路线

②AI产品经理入门指南

③大模型方向必读书籍PDF版

④超详细海量大模型实战项目

⑤LLM大模型系统学习教程

⑥640套-AI大模型报告合集

⑦从0-1入门大模型教程视频

⑧AGI大模型技术公开课名额

可能一切问题，都能解决，所以是：

AGI（Artificial General Intelligence）通用人工智能。

把大模型看做是一个函数，给输入，生成输出
任何问题，都可以用语言描述，成为大模型的输入，就能生成问题的结果

找落地场景的思路：

从最熟悉的领域入手
让 AI 学最厉害员工的能力，再让 ta 辅助其他员工，实现降本增效
找「文本进、文本出」的场景
别求大而全。将任务拆解，先解决小任务、小场景（周鸿祎：「小切口，大纵深」）

四、大模型是怎么生成结果的？

通俗原理：它是根据上文，猜下一个词（的概率）……

略深一点的通俗原理：

不严密但通俗的语言描述大模型的工作原理：

大模型阅读了人类曾说过的所有的话。这就是「机器学习」，这个过程叫「训练」
把一串 token 后面跟着的不同 token 的概率存入「神经网络」。保存的数据就是「参数」，也叫「权重」
当我们给它若干 token，大模型就能算出概率最高的下一个 token 是什么。这就是「生成」，也叫「推理」
用生成的 token，再加上上文，就能继续生成下一个 token。以此类推，生成更多文字

Token 是什么？

可能是一个英文单词，也可能是半个，三分之一个
可能是一个中文词，或者一个汉字，也可能是半个汉字，甚至三分之一个汉字
大模型在开训前，需要先训练一个 tokenizer 模型。它能把所有的文本，切成 token

再深一点的原理：

这套生成机制的内核叫「Transformer 架构」，还有其他架构。

Transformer架构：

五、用好 AI 的核心

把AI当人看！

六、大模型应用架构

大模型技术分两个部分：

训练基础大模型：全世界只需要 1000 人做这个
建造大模型应用：所有技术人，甚至所有人，都需要掌握

大模型应用技术特点：门槛低，天花板高。

典型业务架构：

Agent 还太超前，Copilot 值得追求。

技术架构：

（1）纯 Prompt

就像和人对话，你说一句，ta 回一句，你再说一句，ta 再回一句……

（2）Agent + Function Calling

Agent：AI 主动提要求
Function Calling：AI 要求执行某个函数
场景举例：你问过年去哪玩，ta 先反问你有多少预算

（3）RAG（Retrieval-Augmented Generation）

Embeddings：把文字转换为更易于相似度计算的编码。这种编码叫向量
向量数据库：把向量存起来，方便查找
向量搜索：根据输入向量，找到最相似的向量
场景举例：考试时，看到一道题，到书上找相关内容，再结合题目组成答案。然后，就都忘了

（4）Fine-tuning

努力学习考试内容，长期记住，活学活用。

如何选择技术路线：

值得尝试 Fine-tuning 的情况：

提高大模型的稳定性
用户量大，降低推理成本的意义很大
提高大模型的生成速度

基础模型选型，也是个重要因素。合规和安全是首要考量因素。

然后用测试数据，在可以选择的模型里，做测试，找出最优。

如何学习AI大模型？

现在社会上大模型越来越普及了，已经有很多人都想往这里面扎，但是却找不到适合的方法去学习。

作为一名资深码农，初入大模型时也吃了很多亏，踩了无数坑，现在我想把我的经验和知识分享给你们，帮助你们学习AI大模型，能够解决你们学习中的困难。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2024最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2024最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2024最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2024最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

四、AI大模型商业化落地方案

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2024最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

程序员丸子

关注

18
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

大模型学习笔记 | 1.基础知识

可能一切问题，都能解决，所以是 ：

AGI（Artificial General Intelligence）通用人工智能。

四、大模型是怎么生成结果的？

通俗原理：它是根据上文，猜下一个词（的概率）……

略深一点的通俗原理：

再深一点的原理：

这套生成机制的内核叫「Transformer 架构」，还有其他架构。

五、用好 AI 的核心

六、大模型应用架构

典型业务架构：

技术架构：

（1）纯 Prompt

（2）Agent + Function Calling

（3）RAG（Retrieval-Augmented Generation）

（4）Fine-tuning

如何选择技术路线：

如何学习AI大模型？

一、全套AGI大模型学习路线

二、640套AI大模型报告合集

三、AI大模型经典PDF籍

四、AI大模型商业化落地方案

可能一切问题，都能解决，所以是：