pylucene入门

原创 2011年01月16日 12:46:00

本文只对一次无聊的成功的经历做个记录,就算是来祭奠快逝去的2010年吧~~

 

pylucene: http://lucene.apache.org/pylucene/index.html

PyLucene is a Python extension for accessing Java Lucene. Its goal is to allow you to use Lucene's text indexing and searching capabilities from Python

 

基础环境:(试验机环境)

pylucene-3.0.3-1 http://mirror.bjtu.edu.cn/apache//lucene/pylucene/pylucene-3.0.3-1-src.tar.gz 内附:Jcc 2.7

Python 2.5.4

Java 1.6.0_16

Red Hat 4.1.2-46

GCC 4.1.2

Ant 1.6.5

 

准备上面的环境,download pylucene tar包并解压缩

pushd jcc

Edit setup.py and review that values in the INCLUDES, CFLAGS, DEBUG_CFLAGS, LFLAGS and JAVAC are correct for your system(我的jdk是自己装的,所以修改了JDK[linux2],其他review后没问题)

$ python setup.py build
$ sudo python setup.py install(到此Jcc安装完毕)

 

popd

edit Makefile to match your environment(只需要把你对应的linux那部分注释去掉,然后更改下PREFIX_PYTHON,如果python是你自己装的话)

make

sudo make install

make test (look for failures)(到此pylucene安装完毕)

 

cd sample

python IndexFiles <doc_directory> 会把<doc_directory目录里的文本文件建立一个index的索引放在当前目录

python SearchFiles.py 交互式查询刚才建立的index中的内容

 

~.~

pylucene分别安装在linux和windows(官方无Windows版的pylucene,要自编译)

pylucene 安装 目前python很多包只支持32位,不支持64位。所以安装python尽量使用32位。不要64位,否则很多功能用不了 http://blog.csdn.net/orz...
  • longshenlmj
  • longshenlmj
  • 2017年01月17日 00:08
  • 1257

搜索引擎–Python文本文件分割、PyLucene建立索引和索引搜索

主机平台:Ubuntu 13.04Python版本:2.7.4PyLucene版本:4.4.0原创作品,转载请标明:http://blog.yanming8.cn/archives/108最近想使用P...
  • yming0221
  • yming0221
  • 2013年09月29日 17:28
  • 4997

Lucene 实例教程(三)之操作索引

一、 前言 前面简单介绍了如何使用Lucene将索引 写入磁盘,并且提供IKAnalyzer中文分词器操作索引和检索索引文件,地址:http://blog.csdn.net/cheng...
  • ch656409110
  • ch656409110
  • 2013年08月27日 21:50
  • 6406

PyLucene学习笔记 文件索引及检索

一、使用Indexer建立文本文件索引       这里简化为对某一目录下面的所有后缀为“.py”的文件建立索引。 ''' Created on 2011-11-16 @author: ki...
  • killua_hzl
  • killua_hzl
  • 2011年11月21日 00:22
  • 1118

Ubuntu 安装 pylucene 踩坑还原记,并安装 SmartChineseAnalyzer

Ubuntu 安装 pylucene , SmartChineseAnalyze
  • coder_oyang
  • coder_oyang
  • 2017年08月04日 16:30
  • 458

Linux上安装PyLucene

首先我的环境: ubuntu16.04 Anaconda3下 python3.5.2/python2.7 JDK1.8.0_102 PyLucene6.4.1 Step0.安装openjdk 开始因...
  • zhaohe1995
  • zhaohe1995
  • 2017年02月24日 14:04
  • 582

PyLucene学习之二

文档和域文档是Lucene索引和搜索的原子单位,文档为包含一个或多个域的容器,而域则依次包含”真正的“被索引内容。索引提取文本->创建对应Document实例->通过分析将域文本处理成大量语汇单元->...
  • github_15549139
  • github_15549139
  • 2016年02月03日 11:24
  • 589

Ubuntu 16.04 安装 PyLucene

Ubuntu 16.04 安装 PyLucene 系统:Ubuntu 16.04 64 bit PyLucene:6.4.1 安装配置JDK 安装配置 Ant 安装JCC PyLucene 补充 最...
  • thuyx
  • thuyx
  • 2017年04月05日 18:34
  • 287

PyLucene中使用自己的Analyzer

PyLucene通过继承扩展定制 系统:Ubuntu 16.04 64 bit PyLucene:6.4.1 JDK8u_121 PyLucene通过继承扩展定制 PyLucene基本工作原理 添加 ...
  • thuyx
  • thuyx
  • 2017年04月24日 13:28
  • 371

搜索引擎–Python文本文件分割、PyLucene建立索引和索引搜索

主机平台:Ubuntu 13.04Python版本:2.7.4PyLucene版本:4.4.0原创作品,转载请标明:http://blog.yanming8.cn/archives/108最近想使用P...
  • yming0221
  • yming0221
  • 2013年09月29日 17:28
  • 4997
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:pylucene入门
举报原因:
原因补充:

(最多只允许输入30个字)