基于python+whoosh的全文检索实现

本文介绍了基于Python的全文检索库Whoosh,它无需编译器即可运行,且创建的索引体积小。Whoosh支持自定义排名功能,并提供了多种预定义的字段类型,如ID、STORED、KEYWORD、TEXT、NUMERIC、BOOLEAN和DATETIME等,适用于不同的数据存储和检索需求。
摘要由CSDN通过智能技术生成

Whoosh很快,但只使用纯Python,因此它可以在Python运行的任何地方运行,而无需编译器。
默认情况下,Whoosh使用Okapi BM25F排名功能,但与大多数事情一样,排名功能可以轻松定制。
与许多其他搜索库相比,Whoosh创建了相当小的索引。
Whoosh中的所有索引文本都必须是unicode。
Whoosh允许您使用索引文档存储任意Python对象。
示例:

from whoosh.qparser import QueryParser
from whoosh.index import create_in
from whoosh.index import open_dir
from whoosh.fields import *
from jieba.analyse import ChineseAnalyzer
from get_comment import SQL
from whoosh.sorting import FieldFacet
 
analyser = ChineseAnalyzer()    #导入中文分词工具
schema = Schema(phone_name=TEXT(stored=True, analyzer=analyser), price=NUMERIC(stored=True),
                    phoneid=ID(stored=True))# 创建索引结构
ix = create_in("path", schema=schema, indexname='indexname') #path 为索引创建的地址,indexname为索引名称
writer = ix.writer()
writer.add_document(phone_name='name',price ="
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值