java hanlp分词_hanlp 如何快速从分词仅取出人名

String hlm = IOUtil.readTxt("红楼梦.txt");

CoreStopWordDictionary.FILTER = new Filter() {

@Override

public boolean shouldInclude(Term term) {

if(term.nature.startsWith("nr")) {//当为词性为nr人名时放行,其他过滤掉

return !CoreStopWordDictionary.contains(term.word);

}else{

return false;

}

}

};

Occurrence occurrence = new Occurrence();

occurrence.addAll(hlm);

occurrence.compute();

Set> uniGram = occurrence.getUniGram();

List> wordList = new ArrayList>(uniGram);

Collections.sort(wordList,new Comparator>() {// 根据value排序

public int compare(Map.Entry o1, Map.Entry o2) {

double result = o2.getValue().getFrequency() - o1.getValue().getFrequency();

if (result > 0)

return 1;

else if (result == 0)

return 0;

else

return -1;

}

});

// wordList = wordList.subList(0, 50);

for (Map.Entry entry : wordList) {

TermFrequency termFrequency = entry.getValue();

System.out.println(termFrequency);

}

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值