如果您刚开始学习机器学习,您可能已经阅读过术语“向量嵌入”以及 NLP(自然语言处理)。但这是什么?
向量?哪种载体?
术语“矢量”可能非常含糊,因为它根据上下文具有不同的含义。在物理学中,矢量描述 3D 空间内的大小和方向的量。在编程中,向量通常与数组同义,而在数学中,向量有其独特的定义。生物学中甚至有载体,而且这个例子还在继续。
为了我们在机器学习中的目的,我们需要关注数学和编程向量,我们将看到它们是如何紧密相连的。
数学向量
数学向量继承自物理学,因此它们是具有方向、意义和大小的值。
i 和j是大小相同但方向不同的一维(一维)向量。
我们还有 2D 和 3D 向量:
那么…数学向量和物理向量有什么区别?
虽然物理向量用于表示和分析真实物理量,但数学向量是任意的,不一定表示(并遵守😶)物理属性和规则。例如,OpenAI 生成的向量嵌入有 1536 个维度。
一个向量怎么会有 1536 个维度?
这怎么可能?我们只有 3 个维度,对吧?正确的!
但正如我之前所说,数学向量是任意的,因此它们的维度不一定与真实的物理世界