JE分词器

/*这段代码写的是JE分词器对于所输入的文本进行分词

* 这里还可以自己设定,分词的范围和单个词语,这样用户可以更加方便对想要

*处理的文本更加的灵活多变。

*这里我添加的例子是.addWord(“回首雅虎在中国”);

* */



这个截图是没有加入自己设定的分词内容时候的分词结果:





加入自己定义分词内容后的截图:





package analyzer;


import jeasy.analysis.MMAnalyzer;


public class JE {


public JE() {
// TODO Auto-generated constructor stub


try{
String test = "回首雅虎在中国走过的道路,从目录试的搜索到 " 
+"综合门户的网站,再回归到搜索,之后再一次抛弃简介的搜索" 
+ "引擎界面, 在主页上加入了门户元素,直至目前单独开辟搜"
+"索域名,将cn.yahoo主页定个位门户和论坛社区的结合"
+"体, 可以说雅虎走火了一条颇为曲折的道路,在这个过程"
+"中,不能说没有走出去的机会,但是自身的重重问题让雅虎一"
+ "次次与机会失之交臂,远的暂且不说只从雅虎和阿里巴"
+"巴联盟之后说起";

MMAnalyzer analyzer = new MMAnalyzer();
//这里还可以自己设定分词的每个单个的、词,这里我把”回首雅虎在中国“
//这几个字当做是一个词,那么显示出来的结果就是添加后样子
MMAnalyzer.addWord("回首雅虎在中国");
System.out.println(analyzer.segment(test, " | "));
}catch(Exception e){
e.printStackTrace();
}
}


public static void main(String[] args) {
// TODO Auto-generated method stub

JE je = new JE();

}


}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

杨鑫newlfe

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值