多词表达
Chen__Wu
这个作者很懒,什么都没留下…
展开
-
基于双链式条件随机场(2-CRF)的联合多词表达识别抽取(论文解读)+Bi-LSTM+CRF实现多词表达抽取(代码实践)
一、Introduction将文本切分为最小的单元与用语义类标记这些单元密切相关。原创 2019-07-20 22:25:20 · 574 阅读 · 0 评论 -
复合名词抽取
1、基于规则的方法:主要通过领域语料进行大规模分析,根据复合词的构词特点,人归纳总结复合词构词规则库,利用这些规则库进行匹配抽取领域复合词。准确率高,难度大,规则以及实体关系的构建比较困难。2、基于统计的方法:利用统计策略提取出潜在的新词,然后再利用语言知识和其他统计方法学到的知识过滤干扰字串,eg:crf。基于统计的方法效率比较高,可移植性也比较高,普遍性好,就是准确率有时候不太理想。...原创 2019-08-29 23:03:18 · 615 阅读 · 0 评论