揭秘AI世界：一网打尽大模型、AIGC等热门概念，快速提升你的学习力！

最新推荐文章于 2024-09-10 13:47:50 发布

AIGC莹子

最新推荐文章于 2024-09-10 13:47:50 发布

阅读量686

点赞数 7

文章标签：人工智能 AIGC 学习 transformer 架构深度学习前端

本文链接：https://blog.csdn.net/z551646/article/details/142090830

版权

AI（人工智能）

人工智能 (AI) 是对人类智慧行为的仿真。它涵盖了各种技术和领域，目的是让计算机模仿、延伸甚至超越人类智能。

本质就是帮人工作做事的工具。

AGI（通用人工智能）

AGI，全称为Artificial General Intelligence，也就是通用人工智能，是一种理论性的人工智能形态，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。。它拥有全面的理解、学习和知识应用能力，其智能水平在各方面都与人类相当，甚至有超越之处。这种AI的特点是，它能够将在某一领域学到的知识理解、学习并应用到任何其他领域中。

本质是能干任何事情的超级AI。

AIGC（人工智能生成内容）

AIGC，全称为人工智能生成内容（Artificial Intelligence Generated Content），AIGC的意思是指利用人工智能技术生成内容。AIGC指的是利用AI技术，尤其是机器学习和深度学习模型，自动生成内容，如文本、图像、音乐或视频。AIGC通常专注于特定的创作任务，而不具备AGI的广泛智能和通用学习能力。

本质是利用AI创作一些特定的东西，像是文本，图像，音乐等，核心是创造力。

NLP（自然语言处理领域）

NLP，全称是 Natural Language Processing，翻译成中文称作：自然语言处理。它是计算机和人工智能的一个重要领域。顾名思义，该领域研究如何处理自然语言。其以语言为对象，利用计算机技术来分析、理解和处理自然语言的一门学科,即把计算机作为语言研究的强大工具，在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。

NLP核心组成：NLP = NLU + NLG，NLU 负责理解内容，NLG 负责生成内容。自然语言生成NLG负责将机器生成的非语言格式的数据转换成人类可以理解的语言格式。自然语言理解NLU负责将机器变得像人一样，具备正常人的语言理解能力。

本质就是人类和机器之间沟通的桥梁。

LLM（大语言模型）

通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型，称之为LLM，全称是large language model，即大语言模型。

LLM是对训练文本信息的压缩，同时拥有了泛化能力，不同于数据库和搜索引擎，LLM能创造性地生成历史上没有出现过的文本内容。

目前LLM最大的缺陷是幻觉严重，经常会生成无中生有的回复，如果你没有对应的专业知识，很容易被带偏。所以如果你要用于工作、教育等严肃场景，人工二次校验是必要的。幻觉短期内是无法消除的，甚至LLM的泛化能力也跟幻觉有关，就像人类会做离奇的梦一样。为了解决LLM回复准确性的问题，RAG技术被广泛应用。

本质是用大量数据训练过后有一定理解能力的AI，是NLP的具体实例。

PGC（专业生产内容）

PGC，全称Professional Generated Content，指专业生产内容。专业生产内容模式，主要表现为由专家或者机构来进行内容的生产，具备专业的内容生产能力，能够保证内容的专业性。PGC专业内容生产者有专业身份（资质、学识），往往是出于“爱好”，义务的贡献自己的知识，形成内容。

本质是指具有专业领域专业化，高品质的知识内容。

UGC（用户原创内容）

UGC(User Generated Content)，指用户原创内容。 用户生成内容模式，主要以用户的需求为起点，用户创作以后把生产的内容，通过互联网平台进行发布和展示，可以让更多人看到，帮助别人的同时也成长自己，甚至进行变现。

本质是非专业人士，也就是一般用户发表的个性化内容，就像抖音。

PUGC（用户原创专业生产内容）

PUGC(Professional user-generated Content)，即以UGC形式产出的相对接近PGC的专业内容。 PUGC更注重的是内容生态链，通过UGC 和PGC种模式之间的相互嵌套和融合，集合了UGC、PGC的双重优势，一方面具备了UGC的多元化、个性化等优势，另一方面也发挥了PGC专业化、高品质的特点，更有利于内容的垂直化和个性化。

本质是既专业化又有个性化的内容。

Transformer

GPT（GPT-3、GPT-3.5、GPT-4）

BERT

RoBERTa

T5

XlNet

GShard

Switch Transformer

InstrucGPT

ChatGPT

Alpaca（羊驼）

LLaMA

Vicuna 俗称「小羊驼」（骆马）

ChatGLM

BLOOM

Diffusion （扩散）

CLIP

Stable Diffusion

Fine-tuning （微调）

Self-Supervised Leaning （自监督学习）

Self-Attention Mechanism （自注意力机制）

Zero-Shot Learning （零样本学习)

AI Alignment (AI 对齐)

Positional Enconding （位置编码）

规模（Scale）

复杂性（Complexity）

数据需求（Data Requirement）

计算资源（Computational Resources）

泛化能力（Generalization）

预训练（Pre-training）

多任务学习（Multi-task Learning）

迁移学习（Transfer Learning）：

迁移学习是指将在一个任务上学到的知识应用到另一个相关任务上。这可以加速新任务的学习过程。

模型并行（Model Parallelism）：

模型并行是一种技术，通过将模型的不同部分分布到不同的设备上，来训练非常大的模型。

数据并行（Data Parallelism）：

将数据分割成多个批次，同时在多个设备上进行训练，以加速训练过程。

模型压缩（Model Compression）：

模型压缩技术如剪枝、量化和知识蒸馏，旨在减少模型的大小和计算需求，同时尽量保持模型性能。

模型解释性（Model Interpretability）：

大模型的决策过程往往不透明，模型解释性是指开发方法来理解和解释模型的行为。

模型鲁棒性（Model Robustness）：

鲁棒性是指模型对于输入数据的微小变化或异常值的抵抗能力。提高鲁棒性可以减少模型出错的可能性。

伦理和偏见（Ethics and Bias）：

由于大模型可能会从有偏见的训练数据中学习，因此需要采取措施来识别和减少这些偏见，以确保模型的公平性和伦理性。

可扩展性（Scalability）：

可扩展性是指模型能够处理更大规模的数据集和更复杂的任务的能力。

实时性（Real-time Performance）：

在某些应用中，如自动驾驶或实时翻译，大模型需要能够快速响应并处理数据。

云服务（Cloud Services）：

云服务提供了必要的计算资源和存储空间，使得训练和部署大模型成为可能。

开源（Open Source）：

开源意味着模型的架构和代码可以被任何人访问和使用，这促进了技术的共享和创新。

端到端训练（End-to-End Training）：

指的是模型从输入到输出的整个流程在训练过程中是连贯的，不需要人为干预来设计特征。

注意力机制（Attention Mechanism）：

变换器架构中的一个关键组成部分，允许模型在处理序列时动态地关注序列的不同部分。

层标准化（Layer Normalization）：

一种用于稳定和加速深层神经网络训练的技术，通过规范化层的输入来减少内部协变量偏移。

优化算法（Optimization Algorithms）：

用于训练大模型的算法，如Adam、SGD等，它们影响模型参数更新的方式和速度。

正则化（Regularization）：

除了早停和Dropout，还有其他正则化技术，如权重衰减，用于防止模型过拟合。

超参数（Hyperparameters）：

这些是在训练模型之前需要设置的参数，如学习率、批大小、训练轮数等，它们对模型性能有重要影响。

评估策略（Evaluation Strategies）：

除了使用标准的评估指标外，还需要考虑模型在不同子集上的表现，以确保公平性和泛化能力。

集成学习（Ensemble Learning）：

将多个模型的预测结果结合起来，以提高整体性能和鲁棒性。

知识蒸馏（Knowledge Distillation）：

一种压缩技术，通过训练一个小型模型来模仿大型模型的行为，以减少计算需求。

元学习（Meta-learning）：

也称为“学会学习”，指的是模型能够从过去的任务中学习如何更快地学习新任务。

隐私保护（Privacy Preservation）：

在训练和部署大模型时，需要考虑数据的隐私保护，例如使用差分隐私技术。

安全性（Security）：

确保模型在面对恶意攻击时的安全性，如对抗性攻击。

可审计性（Auditability）：

能够追踪模型的决策过程，以便于审计和合规性检查。

硬件加速（Hardware Acceleration）：

除了GPU和TPU，还有其他硬件加速技术，如FPGA和ASIC，它们可以用于特定类型的计算任务。

模型部署（Model Deployment）：

涉及将训练好的模型集成到生产环境中，可能包括模型服务化、容器化等技术。

模型监控（Model Monitoring）：

1、先到网上查最核心相关概念的信息，控制在20个左右，可以问ChatGPT。 2、在大量搜索相关内容学习后，用自己的语言阐述出来，站在教学者的角度。 3、在模型部署后，持续监控其性能和行为，以确保稳定性和准确性。

跨领域应用（Cross-domain Application）：

大模型可以被应用于多个不同的领域和任务，展示出其灵活性和通用性。

模型版本控制（Model Versioning）：

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓