Whoosh很快,但只使用纯Python,因此它可以在Python运行的任何地方运行,而无需编译器。
默认情况下,Whoosh使用Okapi BM25F排名功能,但与大多数事情一样,排名功能可以轻松定制。
与许多其他搜索库相比,Whoosh创建了相当小的索引。
Whoosh中的所有索引文本都必须是unicode。
Whoosh允许您使用索引文档存储任意Python对象。
示例:
from whoosh.qparser import QueryParser
from whoosh.index import create_in
from whoosh.index import open_dir
from whoosh.fields import *
from jieba.analyse import ChineseAnalyzer
from get_comment import SQL
from whoosh.sorting import FieldFacet
analyser = ChineseAnalyzer() #导入中文分词工具
schema = Schema(phone_name=TEXT(stored=True, analyzer=analyser), price=NUMERIC(stored=True),
phoneid=ID(stored=True))# 创建索引结构
ix = create_in("path", schema=schema, indexname='indexname') #path 为索引创建的地址,indexname为索引名称
writer = ix.writer()
writer.add_document(phone_name='name',price ="