中科院分词ICTCLAS5.0_JNI 使用方法

1.简介

中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果),基于角色标注的未登录词识别能取得高于90%召回率,其中中国人名的识别召回率接近98%,分词和词性标注处理速度为31.5KB/s。ICTCLAS 和计算所其他14项免费发布的成果被中外媒体广泛地报道,国内很多免费的中文分词模块都或多或少的参考过ICTCLAS的代码。

2.下载

下载地址:

下载以后解压。

解压后的目录结构:


必要说明:

user.lic,用户授权文件。

3.新建Eclipse项目。

然后将打开API文件夹下的ICTCLAS文件夹拷贝到src目录下,其它的文件夹和文件全部拷贝到工程目录下。工程结构如图所示:


4.测试

你可以自己新建一个测试类,也可以使用已有的测试类。

比如Sample文件夹里有个例子:TestMain.java,你可以将它复制到Eclipse中。然后运行。就可以看到结果了。

注意,ICTCLAS会自动生成一个ICTCLAS.log文件,查看这个文件能获取许多有用的信息。

5.各种问题。

a.Exception in thread "main" java.lang.UnsatisfiedLinkError: ICTCLAS50.ICTCLAS_Init([B)Z
	at ICTCLAS50.ICTCLAS_Init(Native Method)
	at TestMain.testICTCLAS_ParagraphProcess(TestMain.java:33)
	at TestMain.main(TestMain.java:13)

解决办法:

这种情况是你把ICTCLAS50_Windows_32_JNI\API\ICTCLAS\I3S\AC目录下的类ICTCLAS50.java 没有放到包ICTCLAS.I3S.AC里。

b.将Data文件夹和其它文件,放置到一个configure文件夹下ICTLAS不识别:

Exception in thread "main" java.lang.UnsatisfiedLinkError: no ICTCLAS50 in java.library.path
	at java.lang.ClassLoader.loadLibrary(Unknown Source)
	at java.lang.Runtime.loadLibrary0(Unknown Source)
	at java.lang.System.loadLibrary(Unknown Source)
	at ICTCLAS.I3S.AC.ICTCLAS50.<clinit>(ICTCLAS50.java:26)
	at TestMain.testICTCLAS_ParagraphProcess(TestMain.java:32)
	at TestMain.main(TestMain.java:15)
即加载库文件和Data文件夹、用户授权文件user.lic的错误。

解决办法:

一种方法是:修改ICTCLAS50类和测试类的参数,指定库文件。

static
	{
		String path = new File("").getAbsolutePath()+"\\configure\\ICTCLAS50.dll";
//		System.loadLibrary("ICTCLAS50");
		System.load(path);
	}
然后再修改TestMain类中的testICTCLAS_ParagraphProcess()方法的argus的值,告诉ICTCLAS,你改变了工程目录。

部分代码如下:

ICTCLAS50 testICTCLAS50 = new ICTCLAS50();
//			//String argu = ".";
			String argu = new File("").getAbsolutePath()+"\\configure";
			//初始化
			if (testICTCLAS50.ICTCLAS_Init(argu.getBytes("GB2312")) == false)
			{
				System.out.println("Init Fail!");
				return;
			}


还有testICTCLAS_FileProcess()方法。

修改后的工程目录:





  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值