句法分析能够帮助我们更好的理解句子,说白了就是从语法的角度来理解句子的含义。
句法分析难点与方法学习笔记:
此张PPT主要就是说明了由于中文的特性,使得中文的句法分析成熟度不高,较于词法分析的成熟度低。
此张PPT主要在说树库起到的作用,有了树库才有统计学应用于句法分析,即PCFG。
而树库就是用来给候选树打分的基础,有了大规模树库才能够对正确的句法树打一个高分值,而不合理的句法树则会得一个低分,就类似于CRF给NER和词性标注打分一样。
PCFG学习笔记:
主要就是说明PCFG的组成结构,是如何给句子打分的,学习起来没什么难度。
PCFG的三个基本问题其实类似于CRF,尤其是学习问题也类似于深度学习。
其实说优缺点其实就是为了引出依存句法而服务的。
PCFG代码实战学习笔记:
个人感觉代码其实很简单,但我也花了半天的时间才把这些代码调通,最主要是因为下载stanford-parser这个包并且和JDK配合起来花了点时间,视频中只说了去官网,并没有给出下载链接,我开始在官网找好久没找到这个文件在哪,后来问老师,老师直接把压缩包文件发给我了,我很快就把代码给跑通了。这里提个建议,老师应该把stanford-parser这个压缩文件直接和源代码打包捆绑在一起这样有利于初学者提升学习效率。
依存句法分析学习笔记:
PPT给我们展示了为什么需要依存句法分析,最核心的一点就是易于标注,不向PCFG标注树哪么难以标注,仔细一想确实如果要给PCFG进行标注真不容易,树的标注尤其是中文树的标注应该是成本比较高的。
提取句子结构,其实就是分析了上下文,准确率肯定高呀。
语义依存分析:
语义依存能更好的理解句子的意思,即理解说话人的意图,从而使得聊天机器人,问答系统做出的回答更准确。
抽取关键短语代码学习笔记
个人认为这个视频中讲解的代码最核心不是句法树拆解,反而是递归句法树,因为只有递归句法树,才能解决不能多层提取VP短语的BUG。
另外主要是理解stack.pop()、stack.append()带来的树节点的变化。