别再被忽悠了！一文带你认识人工智能专业术语！

Momodel平台

于 2024-08-16 22:30:00 发布

阅读量206

点赞数

文章标签：人工智能 ai 开发语言

原文链接：https://www.theverge.com/24201441/ai-terminology-explained-humans

版权

人工智能是科技领域的热门新事物——感觉每家公司都在谈论如何通过使用或开发人工智能取得进展。但人工智能领域也充满了行话，这使得理解每个新发展的实际内容非常困难。
为了帮助你更好地理解正在发生的事情，我们整理了一些最常见的人工智能术语列表。我们将尽力解释它们的含义以及它们的重要性。

人工智能到底是什么？

人工智能：通常简称为AI，"人工智能"一词在技术上是指致力于使计算机系统像人类一样思考的计算机科学学科。
但现在，我们主要听到AI作为一项技术甚至是一个实体的讨论，而它的确切含义则更难确定。它也经常作为营销流行词使用，这使得它的定义比应有的更加多变。
例如，谷歌经常谈论它多年来一直在投资人工智能。这指的是它的许多产品是如何通过人工智能得到改进的，以及公司提供的工具，如看似智能的Gemini。然后，还有支持许多AI工具的基础AI模型，如OpenAI的GPT。再有就是Meta的CEO马克·扎克伯格，他将AI作为一个名词来指代个别的聊天机器人。
随着越来越多的公司试图将AI作为下一个大事来销售，他们使用该术语和其他相关术语的方式可能会变得更加混乱。你在关于AI的文章或营销中可能会遇到很多短语，为了帮助你更好地理解它们，我整理了许多目前在人工智能领域流传的关键术语的概述。然而，归根结底，这一切都是为了使计算机更智能。
机器学习：机器学习系统在数据上进行训练（稍后我们将更多地解释训练是什么），以便它们可以对新信息进行预测。这样，它们就可以“学习”。机器学习是人工智能领域内的一个领域，对许多AI技术至关重要。
人工通用智能（AGI）：与人类一样聪明或更聪明的人工智能。（特别是OpenAI在AGI上投入了大量资金。）这可能是非常强大的技术，但对许多人来说，它也是关于AI可能性最令人恐惧的前景——想想我们看过的所有关于超级智能机器接管世界的电影！如果这还不够，还有关于“超智能”的工作，或者说比人类更聪明的AI。
生成式AI：一种能够生成新文本、图像、代码等的AI技术。想想你看到的所有有趣（如果偶尔有问题）的答案和图像，它们是由ChatGPT或谷歌的Gemini生成的。生成式AI工具由通常在大量数据上训练的AI模型驱动。
幻觉：不，我们不是在谈论奇怪的幻象。它是这样：因为生成式AI工具的好坏取决于它们训练的数据，所以它们可以“幻觉”，或者自信地编造出它们认为是最好的问题回答。这些幻觉（或者，如果你想完全诚实，胡说八道）意味着系统可能会犯事实错误或给出无意义的答案。甚至还有一些争议，关于AI幻觉是否曾经可以“修复”。
偏见：幻觉并不是在处理AI时出现的唯一问题——这个问题可能早已被预测，因为AI毕竟是被人类编程的。因此，根据它们的训练数据，AI工具可能会表现出偏见。例如，2018年麻省理工学院媒体实验室的计算机科学家Joy Buolamwini和分布式人工智能研究所（DAIR）的创始人兼执行董事Timnit Gebru共同撰写的一篇论文，展示了面部识别软件在尝试识别深色皮肤女性的性别时错误率更高。

我经常听到人们谈论模型。这些模型是什么？

AI模型：AI模型在数据上进行训练，以便它们可以独立执行任务或做出决策。
大型语言模型，或LLMs：一种可以处理和生成自然语言文本的AI模型。Anthropic的Claude，根据公司的说法，是“一个有帮助的、诚实的、无害的助手，具有会话语调”，是一个LLM的例子。
扩散模型：可以用于从文本提示生成图像等事物的AI模型。它们首先向图像添加噪声——例如静态噪声——然后逆转过程，以便AI学会了如何创建清晰的图像。还有与音频和视频一起工作的扩散模型。
基础模型：这些生成式AI模型在大量数据上进行训练，因此可以成为各种应用程序的基础，而无需针对这些任务进行特定训练。（这个术语是由斯坦福研究人员在2021年创造的。）OpenAI的GPT、谷歌的Gemini、Meta的Llama和Anthropic的Claude都是基础模型的例子。许多公司还在营销他们的AI模型为多模态，意味着它们可以处理多种类型的数据，如文本、图像和视频。
前沿模型：除了基础模型，AI公司还在研究他们所谓的“前沿模型”，这基本上只是一个营销术语，用于他们的未发布未来模型。从理论上讲，这些模型可能比今天可用的AI模型更强大，尽管也有人担心它们可能带来重大风险。

但是AI模型是如何获得所有这些信息的呢？

嗯，它们是经过训练的。训练是一个过程，AI模型通过分析数据集以特定方式理解数据，从而进行学习和识别模式。例如，大型语言模型已经通过“阅读”大量文本进行了训练。这意味着当像ChatGPT这样的AI工具回应你的查询时，它们可以“理解”你在说什么，并生成听起来像人类语言并解决你查询的答案。
训练通常需要大量的资源和计算能力，许多公司依赖强大的GPU来帮助训练。AI模型可以输入不同类型的数据，通常是大量的，如文本、图像、音乐和视频。这在逻辑上被称为训练数据。
参数，简而言之，是AI模型在训练过程中学习到的变量。我对这实际上意味着什么的最好描述来自乔治城大学安全与新兴技术中心战略和基础研究资助主任、前OpenAI董事会成员Helen Toner：

参数是AI模型内部的数字，决定输入（例如，一段提示文本）如何转换为输出（例如，提示后的下一个词）。"训练"AI模型的过程包括使用数学优化技术一次又一次地调整模型的参数值，直到模型非常擅长将输入转换为输出。

换句话说，AI模型的参数有助于决定它们将向你输出的答案。公司有时会吹嘘模型有多少参数，作为展示该模型复杂性的一种方式。

我还会碰到其他术语吗？

自然语言处理（NLP）：由于机器学习，机器能够理解人类语言的能力。OpenAI的ChatGPT是一个基本例子：它可以理解你的文本查询并生成文本回应。另一个可以进行NLP的强大工具是OpenAI的Whisper语音识别技术，据报道该公司使用它来转录超过100万小时的YouTube视频，以帮助训练GPT-4。
推理：当生成式AI应用程序实际生成东西时，比如ChatGPT回应关于如何制作巧克力曲奇的请求，通过分享食谱。这是你的计算机在执行本地AI命令时所执行的任务。
令牌：令牌指的是文本块，如单词、单词的一部分甚至单个字符。例如，LLMs会将文本分解为令牌，以便它们可以分析它们，确定令牌之间的关系，并生成回应。模型一次可以处理的令牌越多（称为其“上下文窗口”的数量），结果就越复杂。
神经网络：神经网络是一种计算机架构，它使用节点帮助计算机使用数据进行处理，这些节点可以与人类大脑的神经元相类比。神经网络对于流行的生成式AI系统至关重要，因为它们可以学习理解复杂模式而无需显式编程——例如，在医学数据上进行训练，以便能够进行诊断。
变换器：变换器是一种神经网络架构，它使用“注意力”机制来处理序列各部分之间的关系。亚马逊对于这意味着什么有一个很好的例子：

考虑这个输入序列：“天空是什么颜色？”变换器模型使用内部数学表示来识别颜色、天空和蓝色这些词的相关性和关系。它利用这些知识生成输出：“天空是蓝色的。”

不仅变换器非常强大，而且它们可以比其他类型的神经网络更快地进行训练。自从前谷歌员工在2017年发表了第一篇关于变换器的论文以来，它们已经成为我们如此多地谈论生成式AI技术的一个重要原因。（ChatGPT中的T代表变换器。）
RAG：这个缩写代表“检索增强生成”。当AI模型生成东西时，RAG允许模型从它训练之外的地方找到并添加上下文，这可以提高它最终生成内容的准确性。
假设你问一个AI聊天机器人一些基于它的训练，它实际上不知道答案的问题。如果没有RAG，聊天机器人可能只是幻觉一个错误的答案。然而，有了RAG，它可以检查外部来源——比如，互联网上的其他网站——并使用这些数据来帮助通知它的答案。

硬件呢？人工智能系统在什么上运行？

**Nvidia的H100芯片：**用于AI训练的最流行的图形处理单元（GPU）之一。公司对H100的渴望是因为它被视为在处理AI工作负载方面优于其他服务器级AI芯片。然而，尽管对Nvidia芯片的非凡需求使其成为世界上最有价值的公司之一，但许多其他科技公司也在开发自己的AI芯片，这可能会削弱Nvidia在市场上的控制力。
神经处理单元（NPUs）：计算机、平板电脑和智能手机中的专用处理器，可以在你的设备上执行AI推理。（苹果使用“神经引擎”这个术语。）NPUs在执行你的设备上的许多AI驱动任务（如在视频通话期间添加背景模糊）时，可以比CPU或GPU更有效。
**TOPS：**这个缩写代表“每秒万亿次运算”，是技术供应商用来夸耀他们的芯片在AI推理方面能力的一个术语。

那么，我一直听到的这些不同的人工智能应用是什么呢？

有许多公司已经成为开发AI和AI驱动工具的领导者。有些是根深蒂固的科技巨头，但其他一些是较新的初创公司。以下是一些参与者：

**OpenAI / ChatGPT：**AI现在如此重要的原因，可以说要归功于ChatGPT，这是OpenAI在2022年底发布的AI聊天机器人。这项服务的爆炸性流行在很大程度上让大型科技玩家措手不及，现在几乎每家科技公司都在试图夸耀他们的AI实力。
**Microsoft / Copilot：**微软正在尽可能多地将Copilot整合到其产品中，这是其由OpenAI的GPT模型驱动的AI助手。这家西雅图科技巨头还在OpenAI拥有49%的股份。
**Google / Gemini：**谷歌正在竞相用Gemini为其产品提供动力，这既指公司的AI助手，也指其各种AI模型。
**Meta / Llama：**Meta的AI努力都围绕着它的Llama（大型语言模型Meta AI）模型展开，与其他大型科技公司的模型不同，它是开源的。
**Apple / Apple Intelligence：**苹果正在其产品中增加新的AI功能，这些功能归入Apple Intelligence的范畴。一个重要的新功能是ChatGPT现在可以直接在Siri中使用。
**Anthropic / Claude：**Anthropic是由前OpenAI员工创立的AI公司，它制造了Claude AI模型。亚马逊已经向该公司投资了40亿美元，而谷歌已经投资了数亿美元（还有可能再投资15亿美元）。它最近聘请了Instagram联合创始人Mike Krieger作为其首席产品官。
**xAI / Grok：**这是埃隆·马斯克的AI公司，它制造了Grok，一个大型语言模型。它最近筹集了60亿美元的资金。
**Perplexity：**Perplexity是另一家AI公司。它以其AI驱动的搜索引擎而闻名，该搜索引擎因看似可疑的抓取实践而受到审查。
**Hugging Face：**一个平台，作为AI模型和数据集的目录服务。