前言
AI浪潮已经来袭,我们每个人都身处其中,我相信,每个人都有必要学习AI。
但问题是,该从何学起?我相信这是大部分之前没接触过AI的人的问题,我也是其中一员。我不是AI科学家,之前也没有技术基础,所以,我想将自己的学习结果记录下来,一方面是用自己能理解的话讲出来自己学到的知识,另外一方面也是分享给所有想要在这波浪潮中不被冲走的人。
我是一个不懂技术的普通人,所以这个系列就叫做「普通人学AI」,这是该系列的第二篇文章。
这篇文章主要分为三个部分。首先简单介绍下人工智能的历史,然后是人工智能、机器学习和深度学习之间的区别和联系,最后结合当下人工智能最新的发展水平,梳理一些重要的概念。
一、人工智能:从概念提出到走向繁荣
1956年,几个计算机科学家相聚在达特茅斯会议,提出了“人工智能”的概念,梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。其后,人工智能就一直萦绕于人们的脑海之中,并在科研实验室中慢慢孵化。之后的几十年,人工智能一直在两极反转,或被称作人类文明耀眼未来的预言,或被当成技术疯子的狂想扔到垃圾堆里。直到2012年之前,这两种声音还在同时存在。2012年以后,得益于数据量的上涨、运算力的提升和机器学习新算法(深度学习)的出现,人工智能开始大爆发。据领英近日发布的《全球AI领域人才报告》显示,截至2017年一季度,基于领英平台的全球AI(人工智能)领域技术人才数量超过190万,仅国内人工智能人才缺口达到500多万。人工智能的研究领域也在不断扩大,下图展示了人工智能研究的各个分支,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。
人工智能研究分支
二、人工智能vs机器学习vs深度学习
1.人工智能
其实这三个概念不难理解,我们可以通过一个类比来解释。假设把人工智能比作一个婴儿的大脑,那么机器学习和深度学习就是让这个婴儿的大脑有能力去观看世界、聆听世界,感受世界以及与世界互动。直观的说,深度学习只是服务于人工智能的一个工具(也许在若干年以后,随着科技的发展,会出现一种全新的工具可以代替现在的深度学习去以另外一种技术路线实现人工智能),把这个工具用在语音识别领域,就能让机器更会听;把它用在自然语言处理领域,就能让机器更会理解;而把它用到计算机视觉领域,就能让机器更会看。
2.深度学习
深度学习(Deep Learning)的本质就是各种神经网络,从最早最简单的感知机,到多层神经网络,再到后来引起第一轮AI变革的CNNs、RNNs、Transformers等网络结构,再到如今的AI大模型,其目的都是构建一个合适的神经网络结构,让机器有能力“自己思考”——也称之为“智能”。
大模型毫无疑问是当下最火的概念之一,它把人工智能带入了一个全新的时代,基于各类大模型的AIGC产品(如ChatGPT、Midjourney等)的诞生让人们对AI有了重新的想象。甚至很多人把今年2023年看作通用人工智能(AGI)元年,并认为大模型是帮助人类实现AGI的“终极方案”。
3.机器学习
关于机器学习(Machine Learning),它是比深度学习更为广泛的研究领域,发展的也比较早。在人工智能届有一种说法:认为机器学习是人工智能领域中最能够体现智能的一个分支。从发展历史来看,机器学习也的确是AI领域发展最快的分支之一。
在ML的早期发展阶段,由于计算机运算性能、样本规模等因素的限制,很多ML算法只存在于实验室和paper中,而没法在实际中应用。但是到后来,GPU 、AI芯片和超级计算机的发展很快,使得系统的计算能力和存储能力都有了很大的飞升,数据发掘引领了大数据时代的到来,让原来复杂度很高的算法得以实现,得到的结果也更为精细。理论上,只要计算机计算能力足够强、样本数据量足够大,就可以不断增加神经网络的层数以及改变神经网络的结构,这就是“深度学习”,深度学习代表了机器学习的最新方向,同时也推动着机器学习的发展。
下面这张图很好的概括了人工智能、机器学习与深度学习三者之间的关系。
三、人工智能新时代——AGI与大模型
随着ChatGPT、MidJourney和Stable Diffusion等AIGC产品的爆火,人工智能在世界范围内受到前所未有的关注。随之而来的是AI大模型、通用人工智能(AGI)、大语言模型(LLM)等一系列概念走进人们的视野,至今已经演变成“百模大战”。尤其是GPT犹如惊雷一般的出现刷新了人们对人工智能的认知——创作、翻译、私人教师、变成、润色等等,人们瞬间意识到真的有这样一个“无所不能”先生能实实在在帮助自己提高学习和工作效率。
GPT 之所以如此全能,是因为其背后有大模型作为引擎。大模型的独特性(如“涌现”)使得它超越了以往的深度学习方法赋予了人工智能更多的“智慧”和能力。同时也让人们开始对人工智能有了更多的想象和思考。
总体来说,人工智能可以分为三种形态:
-
Artificial Narrow Intelligence (ANI),弱人工智能;
-
Artificial General Intelligence (AGI),通用人工智能;
-
Artificial Super Intelligence (ASI),超级人工智能。后两者也被统称为“强人工智能”。
严格地讲,我们现在看到的都属于“弱人工智能”——具有特定能力或能完成特定任务的人工智能。例如,赢得国际象棋比赛(RL)或从一系列照片中识别某个物体(CV);包括现在的五花八门的聊天机器人和文生图模型,以及其他各类AIGC产品都应该被划分在ANI范围之内。
而包括AGI和ASI在内的“强人工智能”则更强调具备类似人类的行为能力,例如通过语音文本理解语气和情感的能力。强人工智能的定义是基于其与人类相比的能力。通用人工智能(AGI)的表现将与人类相当,而超级人工智能(ASI),也称为超级智能,将超越人类的智力和能力。这两种形式的强人工智能尚不存在,但该领域的研究正在进行中。尤其是以GPT-4和PaLM-E为代表的多模态大模型的出现,让人们看到了通用人工智能的影子。
AI领域的专家曾经提到通用人工智能需具备的4个要素,分别是:
-
涌现(emergence)
-
代理(agency)
-
功能可见性(affordence)
-
具象(embodiment)
为什么说现在通用人工智能的影子已经初现了呢?
1、首先对于第一点,大模型的“涌现”现象和能力已经被证实。
2、第二点“代理”,意思是AI能够根据用户下达的总任务指令来自动规划并完成一系列子任务以达到最终目标,引入插件功能的ChatGPT,以及前段时间很热门的Manus都属于初步迈进了这个门槛——AI Agent。
3、对于第三点“功能可见性”,它原本是一个认知和行为学领域的概念,描述的是现实世界中某个场景或物体对于人的行为的暗示,告诉人看到某物时应该能联想到它的功能。放到AGI中,其实它的意思就是AGI产品的可用功能应该与用户的需求和操作相匹配。功能可见性更像是在设计AGI系统时应该考虑的产品形态,从而保证人类与人工智能之间更好的进行互动。
4、而第四点“具象”,也称为“具身化”(embodied),则是数字化的人工智能系统与现实世界交流的物理化体现。这个概念听起来有点晦涩,但其实就是指单个AI系统能够接收并理解现实世界中多种模态的信息,比如语音、图像、触觉等等,从而完成复杂的任务。OpenAI的GPT-4模型和谷歌的PaLM-E模型已经初步具备处理多模态信息的能力。此前谷歌曾在PaLM-E项目中演示过基于该模型的机器人完成“具身推理任务”(embodied reasoning task),比如,对机器人下达“去抽屉里拿一包零食”指令,它能够根据自身搭载的各类传感器感知世界,接收并理解多种模态的信息,然后规划子任务从而完成最终任务。
大模型正在给人工智能带来更多可能,而人工智能同样会给人类带来无限可能。之前有不少人讨论称人工智能将会为人类带来第四次工业革命,虽然我对此种观点持谨慎乐观态度,但是不可否认的是,此前人们不敢想象的一些AI工具和应用,正在出现在我们的生活中,就连看起来离我们很远的AGI也如幽灵一般若隐若现,或许它就隐藏在这些大模型的背后,不时地向我们闪现,预告人类它终将到来。
如何系统的去学习大模型LLM ?
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业
?”“谁的饭碗又将不保了?
”等问题热议不断。
事实上,抢你饭碗的不是AI,而是会利用AI的人。
继科大讯飞、阿里、华为
等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?
与其焦虑……
不如成为「掌握AI工具的技术人
」,毕竟AI时代,谁先尝试,谁就能占得先机!
但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。
基于此,我用做产品的心态来打磨这份大模型教程,深挖痛点并持续修改了近70次后,终于把整个AI大模型的学习门槛,降到了最低!
在这个版本当中:
第一您不需要具备任何算法和数学的基础
第二不要求准备高配置的电脑
第三不必懂Python等任何编程语言
您只需要听我讲,跟着我做即可,为了让学习的道路变得更简单,这份大模型教程已经给大家整理并打包,现在将这份 LLM大模型资料
分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程
等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓
一、LLM大模型经典书籍
AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。
二、640套LLM大模型报告合集
这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
三、LLM大模型系列视频教程
四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)
五、AI产品经理大模型教程
LLM大模型学习路线 ↓
阶段1:AI大模型时代的基础理解
-
目标:了解AI大模型的基本概念、发展历程和核心原理。
-
内容:
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例
阶段2:AI大模型API应用开发工程
-
目标:掌握AI大模型API的使用和开发,以及相关的编程技能。
-
内容:
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望
阶段3:AI大模型应用架构实践
-
目标:深入理解AI大模型的应用架构,并能够进行私有化部署。
-
内容:
- L3.1 Agent模型框架
- L3.2 MetaGPT
- L3.3 ChatGLM
- L3.4 LLAMA
- L3.5 其他大模型介绍
阶段4:AI大模型私有化部署
-
目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。
-
内容:
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景
这份 LLM大模型资料
包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程
等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓