java 调用 ictclas50_1-Ictclas50分词系统ForJava

Emma~~~

于 2021-02-27 12:34:16 发布

阅读量62

点赞数

文章标签： java 调用 ictclas50

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28984915/article/details/114811197

版权

Ictclas50是一个分词库，我嘛主要用来做中文分词，其也能分出词性等东西。

1.环境搭建

进入到下载页面进行下载：

如下图：因为我的系统是64位的windows，所以选择了到数第三行进行下载。其JAVA版本是通过JNI去调用dll库，所以下载下来后没有jar包。看到没有，这就是下载下来后的所有东西，里面有Demo，Doc,API，Sample，主要就是Doc里面的文档要去看一下，里面有实例代码啥的。还有就是API，自然是用来开发用的。

把API文件夹里面的东西都拖入到你的工程中，其中ICTCLAS文件夹拖入工程目录下的src文件夹中，这样之后就可以开始使用里ICTCLAS50这个类进行分词了。

2.测试：

查看下ICTCLAS50这个类里面的代码可以看出，其很简单，里面就几个函数，具体用法参见doc文件夹里的文档，里面都有说明和示例。

下面就是那几个函数:

以下为测试代码：

package test;

import java.io.UnsupportedEncodingException;

import ICTCLAS.I3S.AC.ICTCLAS50;

public class test {

/**

* @param args

*/

public static void main(String[] args) {

ICTCLAS50 ictclas50 = new ICTCLAS50();

String argu = ".";

try {

if (ictclas50.ICTCLAS_Init(argu.getBytes("GB2312")) == false)

{

System.out.println("Init Fail!");

}

String text = "loma在做一个分词测试";

//分词处理

byte nativeBytes1[] = ictclas50.ICTCLAS_ParagraphProcess(text.getBytes("GB2312"), 2, 0);

String nativeStr1 = new String(nativeBytes1, 0, nativeBytes1.length, "GB2312");

System.out.println(nativeStr1);

ictclas50.ICTCLAS_Exit();

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

}

}

输出结果：

空格有点小，要睁大眼睛哦~

里面还能输出词性啥的，请看doc里面的文档。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。