分类
- 文本分类:为句子或文档分配类别(例如垃圾邮件过滤)。
- 情感分析:识别一段文本的极性。
信息检索和文档排序
- 句子/文档相似度:确定两个文本的相似程度。
- 问答:用自然语言回答问题的任务。
文本到文本生成
- 机器翻译:从一种语言翻译成另一种语言。
- 文本生成:创建与人类书写的文本无法区分的文本。
- 文本摘要:创建几个文档的缩短版本,以保留其大部分含义。
- 文本简化:使文本更易于阅读和理解,同时保留其主要思想和大致含义。
- 词法规范化:将非标准文本翻译/转换为标准寄存器。
- 释义生成:创建一个保留输入含义但包含单词选择和语法变化的输出句子。
知识库、实体和关系
- 关系抽取:从文本中抽取语义关系。提取的关系通常发生在两个或多个实体之间,并属于特定的语义类别(