2021SC@SDUSC
今天继续对Lucene中的Analysis进行分析
阅读的DotLucene版本是1.9.RC1
PyLucene基本工作原理
首先必须了解 PyLucene是如何实现的,其实 PyLucene 是在 Python 程序中嵌入了一个 JVM 来使用 Lucene,这个工作主要通过 JCC 来完成,JCC 编译 Lucene 源码为 C++,然后在 Python 中通过 JNI 进行调用。
现在我们希望在 Python 中扩展 Java 源码中的类,仍然要借助 JCC。
添加 Java 源码
假设我们要扩展 Lucene 中的类 A,首先要用 Java 写一个子类 PythonA 继承自 A,通常放在 org.apache.pylucene 里。示例代码如下:
package org.apache.pylucene.analysis;
import java.io.Reader;
import org.apache.lucene.analysis.Analyzer;
public class PythonAnalyzer extends Analyzer {
private long pythonObject;
public PythonAnalyzer()
{
}
public void pythonExtension(long pythonObject)
{
this.pythonObject = pythonObject;
}
public long pythonExtension()
{
return this.pythonObject;
}
public void finalize()
throws Throwable
{
pythonDecRef();
}
publi