简单总结一下自然语言处理的任务栈。
贴两个NLP相关的github连接,非常有用:
(NLP-processing):https://github.com/sebastianruder/NLP-progress
(The Super Duper NLP Repo):https://notebooks.quantumstat.com/#
主要有:
(1)词法分析(Lexical Analysis)
(2)句子分析(sentence Analysis)
(3)语义分析(Semantic Analysis)
(4)信息抽取(Information Extraction)
(5)顶层任务(High-level Task)
一、词法分析
- 分词(word Segmentation/Tokenization):对没有明显词编辑的文本进行切分,得到词序列
- 新词发现(Ne