fnlp

分词效果测试:fnlp-demo/src/main/java/org.fnlp.demo.nlp/ChineseWordSegmentation.java

msr:
这里写图片描述

pku:
这里写图片描述

cityu:

这里写图片描述

词性标注测试:fnlp-demo/src/main/java/org.fnlp.demo.nlp/PartsOfSpeechTag.java

发现出现明显词性标注错误,如部分标点符号错标为名词,动词,例如:

词 长/动词 了/时态词 草似的/名词 ,/名词 焦虑/名词 ,/标点 急躁/副词 ,/动词 要/情态词 使/动词 自己/人称代词 冷静/动词 下来/趋向词 ,/动词 镇定/动词 下来/趋向词 ,/标点 学会/动词 主宰/动词 自己/人称代词 ,/动词 变/动词 外部/名词 控制/动词 为/介词 内部/名词 控制/动词 。/标点

依存句法分析测试:fnlp-demo/src/main/java/org.fnlp.demo.nlp/DepParser.java

0 他 人称代词 4 主语
1 其实 副词 4 状语
2 没 副词 4 状语
3 那么 副词 4 状语
4 喜欢 动词 -1 核心词
5 你 人称代词 4 宾语

他 其实 没 那么 喜欢 你
人称代词 副词 副词 副词 动词 人称代词
4 4 4 4 -1 4

依存句法分析代码如下:

private static void test(String word) throws Exception {        
    POSTagger tag = new POSTagger("../models/seg.m","../models/pos.m");
    String[][] s = tag.tag2Array(word);
    try {
        DependencyTree tree = parser.parse2T(s[0],s[1]);
        System.out.println(tree.toString());
        String stree = parser.parse2String(s[0],s[1],true);
        System.out.println(stree);
    } catch (Exception e) {         
        e.printStackTrace();
    }
}

首先,需要对其进行分词和词性处理,

论文给出的系统性能评测结果:

这里写图片描述
参考论文:

FudanNLP: A Toolkit for Chinese Natural Language Processing

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值