[pylucene]Pylucene不能导入SmartChineseAnalyzer的解决办法

SmartChineseAnalyzer是lucene中最好的中分分词器,其实就是ICTCLAS 具体介绍

今天在使用pylucene导入的时候发现不行:

>>> import lucene
>>> from org.apache.lucene.analysis.cn.smart import SamrtChineseAnalyzer

Traceback (most recent call last):
  File "<pyshell#3>", line 1, in <module>
    from org.apache.lucene.analysis.cn.smart import SamrtChineseAnalyzer
ImportError: No module named smart
>>>

说好的pylucene和lucene一样的么,怎么回事?使用:

>>> import org.apache.lucene.analysis.cn
>>> dir(org.apache.lucene.analysis.cn)
['ChineseAnalyzer', 'ChineseFilter', 'ChineseFilterFactory', 'ChineseTokenizer', 'ChineseTokenizerFactory', '__doc__', '__name__', '__package__']
>>>

确实是没有。

网上找了半天只发现一个比较靠谱的,是pylucene开发者的maillist

看了半天没看懂具体啥意思,就知道没装相关的jar,要改Makefile,测试了一下居然直接成功了。

Makefile修改方法:
  1. 找到这么一行

    #JARS+=$(SMARTCN_JAR)            # smart chinese analyzer
    

    删掉这个#

  2. 找到

    --exclude org.apache.lucene.sandbox.queries.regex.JakartaRegexpCapabilities \
    

    在附近加入一句:

    --exclude org.apache.lucene.analysis.cn.smart.AnalyzerProfile\
    

重新make和make install覆盖安装,搞定!

如果有朋友知道具体是怎么回事,可以给我解释下,多谢。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值