AGI时代，程序员想学习大语言模型（LLM），应该从哪里开始？

AI大模型牛牛

于 2024-10-06 14:18:58 发布

阅读量446

点赞数 7

文章标签：语言模型人工智能数据结构机器学习深度学习自动驾驶产品经理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nick_wei0517/article/details/142726345

版权

程序员25岁做什么能够改变35岁被淘汰的命运？

对于程序员的新一轮革命，我觉得人工智能大模型方向是你可以认真审视的一个方向，你可以选择通过它创业，也可以选择进入这个领域，它是一个更加开放的领域，也让程序员有更多的选择，也能创造无限的可能。

大模型技术栈不断更新发展，作为程序员的我们该如何应用大模型技术实现自己的技术飞跃，哪怕只是实现效率提升呢！相信很多的伙伴都有这样的想法，期望通过应用大模型去做一些自己的应用。加上前段时间OpenAI发布会介绍的GPTs，更是无限降低了技术人才以及非技术人才去开发自己的应用门槛。当然，更深层次的应用是我们做技术的更向往的，不管是AI编程，还是模型微调，甚者想要实现自己的模型私有化。

2022年底，随着ChatGPT的横空出世，大模型时代来临了，千亿甚至万亿参数的大模型陆续出现，各大企业、高校争相发声，纷纷推出自己的大模型，这些都预示着通用智能时代的到来。那么我们可以做些什么呢？

作为一个技术开发者，ChatGPT的出现带给我巨大的震撼，也促使我开始思考，相信就像很多人思考的一样，在大模型时代的洪流下，我会被大模型所取代吗？我能够做些什么来抵挡它带来的冲击，他又会带给我什么样的机遇呢？

我开始在各大网站上搜索大模型相关的信息，希望能够尽量多的了解一些大模型的知识，得到一些指导，但很遗憾，大部分信息要么浅尝辄止，要么专业性极强，这些都不是我想要的，我亦很难在其中汲取到我需要的养分。

不过好在也让我找到了一些好的学习平台，也让我对于人工智能大模型这么板块有了一些认知；

我把这个平台分享出来，有需要的朋友们可以添加他们的老师咨询，还可以领一下籽料；

如果需要可以微信扫描下方CSDN官方认证二维码免费领取

一、怎样学好，并应用大模型

AGI（Artificial General Intelligence，通用人工智能）时代，懂AI、懂编程、懂业务的超级个体，会是AGI时代最重要的人。为了成为这样的超级个体，我们需要在哪几个方向发力呢？那就是：原理、实践和认知。

不懂原理就不会举一反三，走不了太远。

不懂实践就只能纸上谈兵，做事不落地。

认知不高就无法做正确的决策，天花板太低。

接着，这个平台的老师给我们展示了我们学员的职业构成，我从来没有见过有哪一门课，学员的组成是这样的复杂与多样。而这也反证了，大模型时代，对各行业的大家都提出了要求，也都给予了机遇，我们站在风口上，应当抓住它。下面我放一张关于这个课程的学习人群，我们也能看出来各个行业领域，看看是否你也是其中一员。

这也让我认识到多模态新一代人工智能的变化之大，相较于过去得确存在很大的变化，我总结以下核心几点：

1、用好AI需要很多数学知识吗？

以前真需要，以后可能不那么需要了。

2、有的知识太深，我理解不了怎么办？

[用到再讲，学以致用]是这堂课的教学理念，很多知识，用着用着就了解了；

少部分数学知识主要集中在数据和模型训练部分，不理解，也不影响使用。

3、感觉讲的太浅了，没学到知识怎么办？

更深的东西，在实践中未必有用；

欢迎随时在群里提问。

4、课听懂了，实际工作中还是不会用怎么办？

NLP的实际问题通常不是由一个算法解决的，我们把拆解问题的思路融入课程中，用心体会。

在了解了这些之后，接下来我们看一些更干、更实的内容，大模型到底能干什么？

大模型能干什么？

当然，我们不难发现，在大模型快速发展的一年，ChatGPT 仍然是当家扛把子，别人追赶的对象。对于问答类的大模型大家难免会有疑问，那大语言模型只能充当聊天机器人吗？

我的回答是：NONONO，它的应用场景，远不止于此。在图像、音视频、编程、文案、知识库等应用上，它都能比传统的处理方式或工具强N多倍

大模型如何生成结果

其实，大模型只是根据上文，猜测下一个词的概率，相当于逐字逐句的生成，而OpenAI 的接口名就叫「completion」，也证明了其只会「生成」的本质。

举个例子：假如我们将“今天我很”的prompt给到大模型，那么他就会返回“高兴，因为我学会了如何使用github”，我们也不知道他为什么返回这句话，但这个例子证明了大模型的回复是一个字一个字依次往后生成的，且每次生成的字都是概率最大的字。

我们可以通俗的解读一下ChatGPT 的工作原理：

GPT「大模型」阅读了人类曾说过的所有的话。这就是「学习」
把一串 token 后面跟着的不同 token 的概率记下来。记下的就是「参数」，也叫「权重」
当我们给它若干 token，GPT 就能算出概率最高的下一个 token 是什么。这就是「生成」
用生成的 token，再加上上文，就能继续生成下一个 token。以此类推，生成更多文字

大模型应用架构

大模型技术分两个部分：

训练基础大模型：全世界只需要1000个人
建造大模型应用：所有技术人员都应该掌握

目前大模型在业务中是如何应用的呢？典型的业务架构有以下三种。

AI Embedded模式是指，大模型技术在业务中仅仅参与某一个单独的分支，是大模型刚刚介入业务的初期阶段。

AI Copilot是指大模型已经逐渐参与到业务中的每个分支，但是还需要人做总体把控与业务派分，是大模型发展的中期阶段。

AI Agent是指大模型已经完全可以独立完成业务分派与执行，人工只需要在最初的时候进行发号指令。

目前Agent还太超前，我们正处于由AI Embedded追求AI Copilot的阶段。

结尾附赠-学习路线图

大模型全套学习路线图

【L1级别:AI大模型时代的华丽登场】

L2级别：AI大模型API应用开发工程

L3级别：大模型应用架构进阶实践

L4级别：大模型微调与私有化部署

一般掌握到第四个级别，市场上大多数岗位都是可以胜任，但要还不是天花板，天花板级别要求更加严格，对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

AI大模型牛牛

关注

7
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。