pylucene的使用

本文介绍了如何使用PyLucene进行全文索引创建和检索,并强调了在处理中文时的编码注意事项。
摘要由CSDN通过智能技术生成

前一段时间做东西用到了pylucene,包括建立索引,检索,高亮显示等等。贴两段代码,希望对大家有用。

pylucene的安装就不多说了,我用的版本是PyLucene-1.9.1。

建立索引:

# !/usr/bin/env python

import  os
import  PyLucene


class  IndexFiles:
    
"""
    create index by PyLucene, just need your dir path,
    the result files saved in the directory index in
    current path
    
"""

    
def   __init__ (self, root, storeDir, analyzer):
        
if   not  os.path.exists(storeDir):
            os.mkdir(storeDir)
        analyzer 
=  PyLucene.StandardAnalyzer()       
        store 
=  PyLucene.FSDirectory.getDirectory(storeDir , True)
        writer 
=  PyLucene.IndexWriter(store, analyzer, True)
        self.indexDocs(root, writer)
        
print   ' optimizing index ' ,
        writer.optimize()
        writer.close()
        
print   ' done '

    
def  indexDocs(self, root, writer):
        
for  root, dirnames, filenames  in  os.walk(root):
            
for  filename  in  filenames:
                
if   no
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值