NegBio: a high-performance tool for negation and uncertainty detection in radiology reports
痛点
- 引文中所称,传统nlp算法的痛点在于对较长的句子,就丧失对句子的分析能力了
- 与该模型对比的方法是Negex,显然就文中提及,我们可以认为negex根据的是类似滑动窗口的方式。
贡献
- 提出了基于语法树,依赖树的否定词分析方法(ps.这两部分的具体实现我交给后续编译原理的学习来进行深刻理解)
- 代码及模型开源
Methods
- metamap是一个针对生物医学的,将文本与词表中概念匹配的工具。
- tokenize 和 parse 是类似词法分析器和语法分析器的工具。将文本转化为Universal dependency graph
- 搜素过程是先找到否定或者模糊的word,再进行sub-graph与规则的匹配。