AGI时代,程序员想学习大语言模型(LLM),应该从哪里开始?

程序员25岁做什么能够改变35岁被淘汰的命运?

     对于程序员的新一轮革命,我觉得人工智能大模型方向是你可以认真审视的一个方向,你可以选择通过它创业,也可以选择进入这个领域,它是一个更加开放的领域,也让程序员有更多的选择,也能创造无限的可能。

     大模型技术栈不断更新发展,作为程序员的我们该如何应用大模型技术实现自己的技术飞跃,哪怕只是实现效率提升呢!相信很多的伙伴都有这样的想法,期望通过应用大模型去做一些自己的应用。加上前段时间OpenAI发布会介绍的GPTs,更是无限降低了技术人才以及非技术人才去开发自己的应用门槛。当然,更深层次的应用是我们做技术的更向往的,不管是AI编程,还是模型微调,甚者想要实现自己的模型私有化。

     2022年底,随着ChatGPT的横空出世,大模型时代来临了,千亿甚至万亿参数的大模型陆续出现,各大企业、高校争相发声,纷纷推出自己的大模型,这些都预示着通用智能时代的到来。那么我们可以做些什么呢?

作为一个技术开发者,ChatGPT的出现带给我巨大的震撼,也促使我开始思考,相信就像很多人思考的一样,在大模型时代的洪流下,我会被大模型所取代吗?我能够做些什么来抵挡它带来的冲击,他又会带给我什么样的机遇呢?

       我开始在各大网站上搜索大模型相关的信息,希望能够尽量多的了解一些大模型的知识,得到一些指导,但很遗憾,大部分信息要么浅尝辄止,要么专业性极强,这些都不是我想要的,我亦很难在其中汲取到我需要的养分。

不过好在也让我找到了一些好的学习平台,也让我对于人工智能大模型这么板块有了一些认知;

我把这个平台分享出来,有需要的朋友们可以添加他们的老师咨询,还可以领一下籽料;

如果需要可以微信扫描下方CSDN官方认证二维码免费领取

一、 怎样学好,并应用大模型

AGI(Artificial General Intelligence,通用人工智能)时代,懂AI、懂编程、懂业务的超级个体,会是AGI时代最重要的人。为了成为这样的超级个体,我们需要在哪几个方向发力呢?那就是:原理、实践和认知。

不懂原理就不会举一反三,走不了太远。

不懂实践就只能纸上谈兵,做事不落地。

认知不高就无法做正确的决策,天花板太低。

接着,这个平台的老师给我们展示了我们学员的职业构成,我从来没有见过有哪一门课,学员的组成是这样的复杂与多样。而这也反证了,大模型时代,对各行业的大家都提出了要求,也都给予了机遇,我们站在风口上,应当抓住它。下面我放一张关于这个课程的学习人群,我们也能看出来各个行业领域,看看是否你也是其中一员。

这也让我认识到多模态新一代人工智能的变化之大,相较于过去得确存在很大的变化,我总结以下核心几点:

1、用好AI需要很多数学知识吗?

以前真需要,以后可能不那么需要了。

2、有的知识太深,我理解不了怎么办?

[用到再讲,学以致用]是这堂课的教学理念,很多知识,用着用着就了解了;

少部分数学知识主要集中在数据和模型训练部分,不理解,也不影响使用。

3、感觉讲的太浅了,没学到知识怎么办?

更深的东西,在实践中未必有用;

欢迎随时在群里提问。

4、课听懂了,实际工作中还是不会用怎么办?

NLP的实际问题通常不是由一个算法解决的,我们把拆解问题的思路融入课程中,用心体会。

在了解了这些之后,接下来我们看一些更干、更实的内容,大模型到底能干什么?

大模型能干什么?

当然,我们不难发现,在大模型快速发展的一年,ChatGPT 仍然是当家扛把子,别人追赶的对象。对于问答类的大模型大家难免会有疑问,那大语言模型只能充当聊天机器人吗?

我的回答是:NONONO,它的应用场景,远不止于此。在图像、音视频、编程、文案、知识库等应用上,它都能比传统的处理方式或工具强N多倍

大模型如何生成结果

其实,大模型只是根据上文,猜测下一个词的概率,相当于逐字逐句的生成,而OpenAI 的接口名就叫「completion」,也证明了其只会「生成」的本质。

举个例子:假如我们将“今天我很”的prompt给到大模型,那么他就会返回“高兴,因为我学会了如何使用github”,我们也不知道他为什么返回这句话,但这个例子证明了大模型的回复是一个字一个字依次往后生成的,且每次生成的字都是概率最大的字。

我们可以通俗的解读一下ChatGPT 的工作原理:

  • GPT「大模型」阅读了人类曾说过的所有的话。这就是「学习」

  • 把一串 token 后面跟着的不同 token 的概率记下来。记下的就是「参数」,也叫「权重

  • 当我们给它若干 token,GPT 就能算出概率最高的下一个 token 是什么。这就是「生成」

  • 用生成的 token,再加上上文,就能继续生成下一个 token。以此类推,生成更多文字

大模型应用架构

大模型技术分两个部分:

  1. 训练基础大模型:全世界只需要1000个人

  2. 建造大模型应用:所有技术人员都应该掌握

目前大模型在业务中是如何应用的呢?典型的业务架构有以下三种。

AI Embedded模式是指,大模型技术在业务中仅仅参与某一个单独的分支,是大模型刚刚介入业务的初期阶段。

AI Copilot是指大模型已经逐渐参与到业务中的每个分支,但是还需要人做总体把控与业务派分,是大模型发展的中期阶段。

AI Agent是指大模型已经完全可以独立完成业务分派与执行,人工只需要在最初的时候进行发号指令。

目前Agent还太超前,我们正处于由AI Embedded追求AI Copilot的阶段。

结尾附赠-学习路线图

大模型全套学习路线图

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值