pylucene构建索引_pyLucene

http://blog.csdn.net/kernelspirit/archive/2008/02/28/2127851.aspx

PyLucene安装及使用

PyLucene是Python对搜索引擎Lucene 的封装,可以通过Python方便的调用Lucene的API。Lucene是全文搜索的模块,可以很方便的嵌入到应用程序中。对于Python的应用程序可以通过PyLucene是程序具备全文搜索的能力。

安装

下载后解压。

拷贝解压目录下Python目录中的文件到C:\Python25\Lib\site-packages下,即可完成安装。

例子

解压目录下有samples例子,可以直接运行IndexFiles.py文件建立索引:

python IndexFiles.py c:/

会在IndexFiles.py同目录下建立Index目录存放建立的索引,上面的命令会把C:盘所有的.txt文件内容进行索引,如果想索引其他类型的文件,修改源代码即可。

运行解压目录下的SearchFiles.py进行查询:

python SearchFiles.py

然后输入文件中的任意单词或汉字都可以查询得到。

http://www.unfish.net/archives/271-20080118.html

PyLucene安装使用简介

星期五, 一月 18. 2008

想给理财易的留言板添加个搜索功能,但是又不想用like这样的搜索语句,慢的要死,搞不好还会成为网站被攻击的漏洞,但是Mysql又不支持中文的全文检索,只支持英文。(似乎最新版的Mysql 6已经可以很方便的用插件方式添加中文全文检索了,而且似乎已经

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要为文本添加全文索引,可以使用Python的PyLucene库。PyLucene是Lucene搜索引擎的Python绑定,它可以在Python中使用Lucene的各种功能。 以下是一个使用PyLucene为文本添加全文索引的示例代码: ```python import lucene from java.io import StringReader from org.apache.lucene.analysis.standard import StandardAnalyzer from org.apache.lucene.document import Document, Field, FieldType from org.apache.lucene.index import IndexWriter, IndexWriterConfig from org.apache.lucene.store import SimpleFSDirectory from org.apache.lucene.util import Version # 初始化Lucene lucene.initVM() # 创建分析器 analyzer = StandardAnalyzer(Version.LUCENE_CURRENT) # 设置字段类型 field_type = FieldType() field_type.setIndexed(True) field_type.setStored(True) field_type.setTokenized(True) # 创建索引目录 index_dir = SimpleFSDirectory(File("index/")) # 创建索引写入器 config = IndexWriterConfig(Version.LUCENE_CURRENT, analyzer) writer = IndexWriter(index_dir, config) # 添加文档到索引 doc = Document() doc.add(Field("content", StringReader("This is some sample text."), field_type)) writer.addDocument(doc) # 提交索引 writer.commit() ``` 在这个示例中,我们首先初始化了PyLucene。然后,我们创建了一个标准分析器,该分析器将文本拆分成单词。接下来,我们设置了文档字段的类型,该字段将被索引、存储和分词。然后,我们创建了一个索引目录,用于存储索引数据。接下来,我们创建了一个索引写入器,并将一个文档添加到索引中。最后,我们提交了索引。 这是一个简单的示例,你可以根据你的需求修改代码来实现更复杂的全文索引功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值