nlp实现词性标注+分句

public List<String> getTag(String text){
List<String> lists=new ArrayList<String>();
   @SuppressWarnings("unchecked")
   List<List<HasWord>> sentences = tagger.tokenizeText(new StringReader(text));//tagger.tokenizeText(new BufferedReader(new FileReader(args[1])));
   for (List<HasWord> sentence : sentences) {
     ArrayList<TaggedWord> tSentence = tagger.tagSentence(sentence);
     String sence="";
     for(TaggedWord tw:tSentence){
     String word=tw.word();
     String tag=tw.tag();
     if(word.equals("-LRB-")){
     word="(";
     }
     if(word.equals("-RRB-")){
     word=")";
     }
     if(sence.length()>0){
     sence=sence+" "+word+"<font color='red'>/"+tag+"</font>";
     }else{
     sence=word+"<font color='red'>/"+tag+"</font>";
     }
     }
     lists.add(sence);
   }
return lists;
}

 public List<String> getClause(String args){

List<String> lists=new ArrayList<String>();
String line;
List<List<HasWord>> sentences = tagger.tokenizeText(new StringReader(args));//tagger.tokenizeText(new BufferedReader(new FileReader(args[1])));
for (List<HasWord> sentence : sentences) {
line="";
 ArrayList<TaggedWord> tSentence = tagger.tagSentence(sentence);
 for(TaggedWord tw:tSentence){
 if(line.length()>0){
 line=line+" "+tw.word();
 }else{
 line=tw.word();
 }
 }
 lists.add(line+"<font color='red'>/end</font>");
}
return lists;
}

转载于:https://www.cnblogs.com/hxy520/archive/2013/02/01/2889468.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值