“AI到底会不会替代人类?”
“3亿人饭碗保不住?AI真的杀疯了!”
“AI将代替人类工作?大学生面临失业?”
…
AI的火爆现象,这样的信息你肯定屡见不鲜,甚至可能因此感到焦虑与不安。对于初涉人工智能领域的朋友而言,这一领域的知识体系既庞大又繁复,各类专业术语层出不穷,常常让人困惑不已,难以捉摸。
AI到底是啥?
AI大模型又是什么?算力?
什么是AIGC?GPT又是什么?
今天小编就带你
什么是AI?
AI,是artificial intelligence的缩写。Artificial,很多同学认字认半边,会以为是艺术(art)的什么形容词。其实不然,artificial的意思就是“人工的、人造的”,和natural(天然的)是反义词。Intelligence,这个不容易认错,是“智能”的意思。英特尔(Intel)公司的名字,就是基于这个词的前五个字母。结合起来,AI,就是“人工的、人造的智能”,用人为的手段,创造智能。
关于AI的定义,行业里有很多种说法。比较学术化的一种,是这么说的:AI是研究、开发用于模拟、延伸和扩展人的智能行为的理论、方法、技术及应用系统的一门综合性科学。这个定义很拗口,看得小编都头大了。其实,对于AI,我们可以拆解来看:
首先,AI的本质属性,是一门科学,是一个技术领域。它涉及到了计算机科学、数学、统计学、哲学、心理学等多种学科的知识,但总体上,归类于计算机学科之下。
其次,AI的研究目的,是让一个“系统”具备智能。这个“系统”,可以是一套软件程序,也可以是一台计算机,甚至是一个机器人。
最后,什么样的水平,才叫做真正的智能。这是问题的关键。目前看来,能够像人一样感知、理解、思考、判断、决策,就是实现了人工智能。配合机器人、机械臂等物理载体,AI也可以实现行动能力。
综合以上三点,理解AI的定义就比较容易了。
什么是大模型?
这两年AI火,就是因为大模型火。那么,什么是大模型?
大模型,是具有庞大参数规模和复杂计算结构的机器学习模型。(参数,是指在模型训练过程中,学习和调整的变量。参数定义了模型的行为、性能、实现的成本以及对计算资源的需求。简单来说,参数是模型内部用来做出预测或决策的部分。)
大模型,通常拥有数百万至数十亿的参数。相对应的,参数少的,就是小模型。对一些细分的领域或场景,小模型也够用。大模型需要依赖大规模数据进行训练,对算力资源的消耗极大。绝大多数大模型的基础核心结构,都是Transformer及其变体。
大模型有很多种类别。通常所说的大模型,主要是指语言大模型(以文本数据进行训练)。但实际上,还有视觉大模型(以图像数据进行训练),以及多模态大模型(文本和图像都有)。
按应用领域,大模型可以分为通用大模型和行业大模型。通用大模型的训练数据集更加广泛,覆盖的领域更加全面。行业大模型,顾名思义,训练数据来自特定行业,应用于专门的领域(例如金融、医疗、法律、工业)
GPT的本质是什么?
GPT-1、GPT-2……GPT-4o,等等,都是美国OpenAI这家公司推出的语言大模型,同样都是基于Transformer架构。
GPT的全称,叫做Generative Pre.trained Transformer,生成式-预训练-Transformer。 Generative(生成式),表示该模型能够生成连续的、有逻辑的文本内容,比如完成对话、创作故事、编写代码或者写诗写歌等。 Pre.trained(预训练),表示该模型会先在一个大规模未标注文本语料库上进行训练,学习语言的统计规律和潜在结构。通过预训练,模型才有了一定的通用性。训练的数据越庞大(如网页文本、新闻等),模型的能力就越强。
大家对于AI的关注热潮,主要源于2023年初的ChatGPT爆火。
ChatGPT的chat,是聊天的意思。ChatGPT是OpenAI基于GPT模型开发的一个AI对话应用服务(也可以理解为GPT-3.5)。通过这个服务,人们才可以亲身体验到GPT模型的强大,有利于技术的宣传和推广。事实证明,OpenAI的策略成功了。ChatGPT充分吸引了公众关注度,也成功推动了AI领域的发展热潮。
什么是AIGC?
AIGC,全名是人工智能生成内容(Artificial Intelligence Generated Content)。这玩意儿可不得了,它借助 AI 技术,能自动产出文本、图像、音频、视频等各种形式的作品。瞅瞅如今,那些自动生成的新闻稿件、栩栩如生的绘画佳作,好多都是 AIGC 的得意之作,毫不夸张地说,它给内容创作领域带来了一场翻天覆地的革新。
什么是算力?
算力就是字面意思,计算能力,计算机进行运算处理的能力,更具体来说,算力是通过对信息数据进行处理,实现目标结果输出的计算能力。通常用于衡量人工智能、区块链、数据分析等领域的计算性能。人工智能领域里的深度学习任务中,需要大量的计算资源来训练和推理模型。因此,算力在这个领域变得尤为重要。强大的算力可以加速训练过程、提高模型的精度和性能,并且处理更复杂的任务和数据集,最终生成新的、原创的内容。
什么是Token?
在AI领域,Token通常指的是模型处理文本或其他类型数据时的基本单位或元素。它是模型理解和处理数据的最小单元,可以是一个单词、一个词组、一个标点符号、一个子词或者一个字符等。Token的划分方式会影响模型对数据的理解和处理。
AI发展到什么地步了?
目前AI的发展进程分为三个阶段,分别是:弱人工智能阶段、强人工智能阶段、超强人工智能阶段。
第一阶段:弱人工智能(Artificial Narrow Intelligence,ANI),也称为狭义人工智能,指的是专门解决特定任务上表现出与人类相似或超越人类能力的人工智能系统,比如语音识别、图像识别、自然语言处理、自动驾驶等领域。这种人工智能系统虽然在特定领域表现出色,但是缺乏综合性和通用性,无法像人类一样进行复杂的推理和判断,不能具备人类的全面智能。
第二阶段:强人工智能(Artificial General Intelligence,AGI),也称为广义人工智能,指的是具备类似人类智能的人工智能系统。这种人工智能系统能够像人类一样进行复杂的推理和判断,具备学习、自我适应和创造的能力。
第三阶段:超级人工智能(Artificial Super Intelligence,ASI),也称为超级智能,指的是远超越人类智能的人工智能系统。这种人工智能系统具备超出人类理解范畴的智能和能力,可以完成人类难以想象的任务,可能具备自己的意识和目标,能够自我学习和进化,甚至超越人类控制和理解的能力。超人工智能的发展和影响还是个未知领域。
当前的人工智能已近乎达到强人工智能的水平。未来,它将进一步发展为超强人工智能,广泛渗透于我们的日常生活,届时我们将把众多工作任务及应用场景委托给AI,以期其创造更多的价值。
2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享**
一、2025最新大模型学习路线
一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。
我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。
L1级别:AI大模型时代的华丽登场
L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理,关键技术,以及大模型应用场景;通过理论原理结合多个项目实战,从提示工程基础到提示工程进阶,掌握Prompt提示工程。
L2级别:AI大模型RAG应用开发工程
L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。
L3级别:大模型Agent应用架构进阶实践
L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体;同时还可以学习到包括Coze、Dify在内的可视化工具的使用。
L4级别:大模型微调与私有化部署
L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。
整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。
二、大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
三、大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
四、大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
五、大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取