1 Text-to-Class:
1)Category:① Text ---> Single Class. ② Text ---> Multi Classes.
2 Text-to-Text:Seq2Seq+Attention.
3 输入:
1)单个句子:直接输入。
2)多个句子:两种方法,整合后再进行训练或者训练后再进行整合。
4 总结:
5 Part-of-Speech (POS) Tagging.(词性标注)
6 Word Segmentation.(分词)(难点在于中文分词,因为中文文本的词之间没有明确的边界。)
7 Parsing.(句法分析)
8 Coreference Resolution.(指代消解)(标记出文本中代词真正指代的实体目标。)
9 Summarization.(文本摘要)
10 Machine Translation.(机器翻译)(现阶段难点在于无监督学习的机器翻译,例如,不需要英文跟中文的对应关系,直接将英文翻译成中文。)
11 Grammar Error Correction.(语法纠错)
12 Sentiment Classification.(情感分类)
13 Stance Detection.(立场检测)(可用于真实性检测,例如新闻的真实性检测,通过检测新闻的立场,该新闻的评论回复立场,wikipedia的立场对真实性进行判断。)
14 Natural Language Inference (NLI)(自然语言推理)
例子:
15 Search Engine(搜索引擎)(传统的搜索引擎都是基于关键字的输出,只考虑了字形,而深度学习的搜索引擎考虑了每个单词在句子中的含义、语境,输出更加相关的结果。)
16 QA.
1)传统方法:
2)深度学习方法:
17 Dialogue.(Chatting&Task-oriented)(在Task-oriented中,Policy的作用是根据State决定下一步的Ask的内容。)
1)Task-oriented:
① Natural Language Understanding.
② 完整的模型:
18 Knowledge Graph.(知识图谱)
1)例子:
2)Name Entity Recognition. (NER)(命名实体识别)
3)Relation Extraction.
例子:
19 评测:
1)GLUE:三大类:① 句子的类别;② 两个句子的相似度;③ 自然语言推理(多个句子输出一个类别)。
2)Super GLUE:
3)DecaNLP:将NLP任务看成QA问题。