一. 一些语言理解技术
- 词意消歧
消除歧义需要联系上下文,利用相邻词汇的相近含义。
2. 指代消解
解决“谁对谁做了什么”,也就是检测动词的主语和宾语,确定代词或名字短语指的是什么。
3. 语义角色标注
确定名词短语如何与动词相关联。
二. 一些自动生成语言的任务(建立在一的基础之上)
1. 自动问答
在自动问答中,一台机器应该能够回答用户关于特定文本集的问题。
2. 机器翻译
难点:一方面给定的单词可能有几种不同的解释,另一方面是必须改变词序才能与目标语言的语法结构保持一致。
3. 人机对话系统
分类和标注词汇
NLP的基本技术:序列标注、N-gram模型、回退和评估。
词性标注:将词汇按他们的词性分类以及相应的标注它们的过程。
标记集:用于特定任务的标记集合。
词性标注器:处理一个词序列,为每个词附加一个词性标注。