中文分词器ikanalyzer 简单使用

依赖

    <!--中文分词器ikanalyzer-->
    <dependency>
      <groupId>com.janeluo</groupId>
      <artifactId>ikanalyzer</artifactId>
      <version>2012_u6</version>
    </dependency>

测试:

/**
 * 测试ikanalyzer中文分词器
 */
public class IKTest {
    @Test
    public void wctest() throws  Exception{
        String string="李天一,现名李冠丰。著名歌唱家李双江和知名歌唱家梦鸽之子。" +
                "根据司法机关公布资料显示,李天一出生于1996年4月。曾就读北京海淀区中关村第三小学、人民大学附中、" +
                "美国Shattuck-St. Mary's School(沙特克圣玛丽学院)冰球学校。2011年9月6日,因与人斗殴被拘留教养1年。2012年9月19日," +
                "李天一被解除教养。2013年2月22日,因涉嫌轮奸案被刑事拘留,后因可查资料显示未成年,移交少管所。3月7日,中央电视台新闻中心" +
                "官方微博发布了一条消息,称李天一因涉嫌强奸罪,已被检察机关批捕。2013年9月,李双江一篇旧文证实李天一成年。" ;
        StringReader reader = new StringReader(string);
        IKSegmenter ik = new  IKSegmenter(reader, true);// 当为true时,分词器进行最大词长切分
        Lexeme lexeme = null;
        while ((lexeme = ik.next()) != null){
            System.out.print(lexeme.getLexemeText()+"|");
        }
    }
}

结果:
李|天一|现名|李|冠|丰|著名|歌唱家|李|双江|和|知名|歌唱家|梦|鸽|之子|根据|司法机关|公布|资料|显示|李|天一|出生于|1996年|4月|曾|就读|北京|海淀区|中关村|第三|小学|人民大学|附中|美国|shattuck-st.|mary|s|school|沙特|克|圣玛丽|学院|冰球|学校|2011年|9月|6日|因|与人|斗殴|被|拘留|教养|1年|2012年|9月|19日|李|天|一被|解除|教养|2013年|2月|22日|因涉嫌|轮奸案|被|刑事拘留|后|因|可查|资料|显示|未成年|移交|少管所|3月|7日|中央电视台|新闻中心|官方|微|博|发布|了|一条|消息|称|李|天一|因涉嫌|强奸罪|已被|检察机关|批捕|2013年|9月|李|双江|一篇|旧|文|证实|李|天一|成年|

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值