AI(人工智能): 先说说AI,这个大家可能都不陌生。AI,就是人工智能,它涵盖了各种技术和领域,目的是让计算机模仿、延伸甚至超越人类智能。想象一下,你的智能手机、智能家居设备,这些都是AI技术的应用。
AIGC(AI生成内容): 接下来是AIGC,即AI Generated Content。这就是利用AI技术生成的内容:
AGI(通用人工智能): 然后我们来看AGI,即Artificial General Intelligence,中文叫通用人工智能。这可比一般的AI高级多了。AGI的目标是创造一个能像人类一样思考、学习、执行多种任务的系统。想象一下,如果有了AGI,它可能会成为全能的“超级大脑”,能在任何领域都超越人类。听起来是不是有点像科幻电影里的情节?
AGI与AIGC(Artificial Intelligence Generated Content,人工智能生成内容)有显著区别。AIGC指的是利用AI技术,尤其是机器学习和深度学习模型,自动生成内容,如文本、图像、音乐或视频。AIGC通常专注于特定的创作任务,而不具备AGI的广泛智能和通用学习能力。
AIGC、NLP、LLM
AIGC涉及到的领域和技术很广泛,其中很重要的一项技术就是NLP(自然语言处理),之所以把这3个概念放在一起描述,这两年来,AIGC取得了令人瞩目的增长,有很大因素就在于自然语言处理(NLP),而推动NLP发展到的就是LLM(大型语言模型),也就是我们接下来学习的重点,LLM。
NLP(自然语言处理)它是研究如何让计算机读懂人类语言,也就是将人的自然语言转换为计算机可以阅读的指令,NLP是人工智能和语言学领域的分支学科。
而LLM是 NLP 中的一个重要组成部分,主要是用来预测自然语言文本中下一个词或字符的概率分布情况,可以看作是一种对语言规律的学习和抽象。
在NLP中,LLM是一种基本技术,用于处理和理解文本,包括词法分析、句法分析、语义分析等,广泛应用于机器翻译、自动问答系统、信息抽取、文本分类、情感分析等多个领域。而LLM,特别是基于Transformer架构的模型,如GPT-3和T5,通过大规模无监督学习来学习语言规律和上下文信息,然后在微调阶段根据具体任务进行有监督学习和优化,从而能够生成连贯、有意义的文本。这些模型的核心在于预训练和微调,预训练阶段使用掩码语言模型或下一句预测等技术,微调阶段则针对特定任务进行优化。
transformer架构
Transformer架构是一种革命性的神经网络架构,最初由Google在2017年提出,其核心特点是使用自注意力机制取代了传统的循环神经网络(RNN)结构。这种架构允许模型在训练时并行处理输入序列中的所有位置信息,从而大大提高了处理长序列数据的效率和效果。Transformer架构主要由编码器和解码器组成,其中编码器负责处理输入数据,解码器则生成输出。自注意力机制是Transformer架构中的关键部分,它使得模型能够关注到输入数据中的不同部分,并据此生成相关的输出。
transformer参考
NLP、GPT、ChatGPT
GPT是NLP领域中的一个重要模型,它是基于Transformer架构构建的预训练语言模型。GPT(Generative Pre-trained Transformer)通过预先训练大量文本数据,学习到语言的基本结构和模式,从而能够理解自然语言文本的意义和语义。
而ChatGPT从名字上就可以看出来,ChatGPT是GPT在对话生成领域的特定应用。
直接观看大神视频
深度学习 Deep Learning
什么是卷积
向量究竟是什么
上述视频看完后大概可以了解AI的基本工作原理了