fnlp

最新推荐文章于 2024-08-08 07:59:26 发布

imperfect00

最新推荐文章于 2024-08-08 07:59:26 发布

阅读量473

点赞数

分类专栏： NLP

本文链接：https://blog.csdn.net/u011961856/article/details/77430950

版权

NLP 专栏收录该内容

28 篇文章 0 订阅

订阅专栏

分词效果测试:fnlp-demo/src/main/java/org.fnlp.demo.nlp/ChineseWordSegmentation.java

msr:
这里写图片描述

pku:
这里写图片描述

cityu:

这里写图片描述

词性标注测试:fnlp-demo/src/main/java/org.fnlp.demo.nlp/PartsOfSpeechTag.java

发现出现明显词性标注错误,如部分标点符号错标为名词,动词,例如:

词长/动词了/时态词草似的/名词，/名词焦虑/名词，/标点急躁/副词，/动词要/情态词使/动词自己/人称代词冷静/动词下来/趋向词，/动词镇定/动词下来/趋向词，/标点学会/动词主宰/动词自己/人称代词，/动词变/动词外部/名词控制/动词为/介词内部/名词控制/动词。/标点

依存句法分析测试:fnlp-demo/src/main/java/org.fnlp.demo.nlp/DepParser.java

0 他人称代词 4 主语
1 其实副词 4 状语
2 没副词 4 状语
3 那么副词 4 状语
4 喜欢动词 -1 核心词
5 你人称代词 4 宾语

他其实没那么喜欢你
人称代词副词副词副词动词人称代词
4 4 4 4 -1 4

依存句法分析代码如下:

private static void test(String word) throws Exception {        
    POSTagger tag = new POSTagger("../models/seg.m","../models/pos.m");
    String[][] s = tag.tag2Array(word);
    try {
        DependencyTree tree = parser.parse2T(s[0],s[1]);
        System.out.println(tree.toString());
        String stree = parser.parse2String(s[0],s[1],true);
        System.out.println(stree);
    } catch (Exception e) {         
        e.printStackTrace();
    }
}

首先,需要对其进行分词和词性处理,

论文给出的系统性能评测结果:

这里写图片描述
参考论文: