IKAnalyzer分词（java、scala实现）

huazi99

已于 2022-03-25 15:14:01 修改

阅读量705

点赞数

文章标签： python 深度学习机器学习 spark

于 2022-03-25 15:13:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huazi99/article/details/123735967

版权

1、IKAnalyzer中文分词功能来自于 org.apache.lucene 库
在这里插入图片描述

2、java编写

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
public static void main(String[] args) throws IOException {       
    Analyzer analyzer=new IKAnalyzer();    
    TokenStream tokenStream = analyzer.tokenStream("", "通往事故核心现场的道路于22日被紧急修通。持续降雨下，路面湿滑，记者发现，较大的泥坑处没过脚背有二三十厘米。为防滑，一块块竹架板铺在地上。");    
    CharTermAttribute charTermAttribute = tokenStream.addAttribute(CharTermAttribute.class); 
    tokenStream.reset();
    while (tokenStream.incrementToken()){
        System.out.println(charTermAttribute.toString());
    }
    tokenStream.close();
}

输出结果

在这里插入图片描述
3、scala编写

val analyzer = new IKAnalyzer()
val ts:TokenStream = analyzer.tokenStream("", "通往事故核心现场的道路于22日被紧急修通。持续降雨下，路面湿滑，记者发现，较大的泥坑处没过脚背有二三十厘米。为防滑，一块块竹架板铺在地上。")
val ter:CharTermAttribute = ts.addAttribute(classOf[CharTermAttribute])
ts.reset()while (ts.incrementToken ) {
  println(ter.toString)
}

ts.close()

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
IKAnalyzer分词（java、scala实现）

IKAnalyzer分词（java、scala实现）
复制链接

扫一扫

huazi99 CSDN认证博客专家 CSDN认证企业博客

码龄21年

69: 原创

9万+: 周排名

3万+: 总排名

7万+: 访问

: 等级

1131: 积分

375: 粉丝

413: 获赞

14: 评论

491: 收藏

私信

关注

热门文章

分类专栏

IT基础 3篇
鸿蒙 29篇
大数据 18篇
前端 12篇
java 4篇

最新评论

鸿蒙开发系列教程（十六）--日志处理
lingHui_1314: debug..., %{public}s 我的输出这样是哪里的原因？
vue实现将iframe保存图片--html2canvas
困困的琨: 我弄出来个空白图片是为啥
鸿蒙开发系列教程（九）--ArkTS语言：ForEach循环渲染
Andre_young: 有可能啊不是有个index吗，可以通过参数控制给第几个对象加按钮
浮点数表示的数值范围详解（二）
做而论道_CS: 吹捧浮点数，有意思吗？浮点数，是有误差的。做不到准确无误的事比如，财务领域，一分钱，都不许出错的。而浮点数，精度不够。　单精度时，只有 7 位数是准确的。如果想要表示超过 7 位数的数值，它就算不出准数了。如，人民币：123456.789 万元，它只能算出：123456.8 万元！如果用 64 的浮点数，精度虽然提高了一些，　但是，也会有算不出来准数的事。
鸿蒙 Router提示 100002错误
YSoup: 跨模块跳转，这几个方法都没用。试了下，路径使用@bundle:的形式就好了，应该是鸿蒙的bug，跳转经常失灵

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。