为了让分词系统更好的识别公司名字,进行了自定义词典实验,具体代码如下:
public static void main(String[] args) {
// TODO Auto-generated method stub
String str = "他来自与百悟科技的北京语言科技公司毕业的大学生,进行一路捞创业" ;
UserDefineLibrary.insertWord("百悟科技", "nzz", 1000);//自定义词汇、自定义词性 nzz 为自定义的词性
UserDefineLibrary.insertWord("一路捞", "nzz", 1001);
UserDefineLibrary.insertWord("北京语言科技公司", "nzz", 1001);
Result terms = ToAnalysis.parse(str);
System.out.println("增加自定义词库:" + terms.toString());
}
具体输出结果:
增加自定义词库:他/r,来自/v,与/p,百悟科技/nzz,的/uj,北京语言科技公司/nzz,毕业/v,的/uj,大学生/n,,/w,进行/v,一路捞/nzz,创业/v