在基于文本向量表示的分类、聚类等任务中,文档向量是一个关键节点。如何将一篇文档用所带信息或概念的向量进行表示,是语义理解的基础。
以下介绍的文档向量皆为向量化表示后的文档向量,可以直接在高维向量空间进行相似性比较。
文档向量按表示的目标分为以下几种:
- 句子向量
- 段落向量
- 文档向量
- 论坛帖子向量
- 表格向量
在基于文本向量表示的分类、聚类等任务中,文档向量是一个关键节点。如何将一篇文档用所带信息或概念的向量进行表示,是语义理解的基础。
以下介绍的文档向量皆为向量化表示后的文档向量,可以直接在高维向量空间进行相似性比较。
文档向量按表示的目标分为以下几种: