Python Django,全文检索,haystack框架,whoosh搜索引擎

本文介绍了如何使用Python的Django框架结合haystack和whoosh实现全文检索。haystack支持多种搜索引擎,包括whoosh。whoosh虽性能稍逊,但适合小型站点。同时,文章还涉及了jieba中文分词的集成,以及配置和使用索引的详细步骤,包括在settings.py和urls.py中的配置,以及search_indexes.py的索引定义。最后,讨论了如何修改whoosh_backend以支持中文分词,并重新生成索引。
摘要由CSDN通过智能技术生成

 

  • haystack:全文检索的框架,支持whoosh、solr、Xapian、Elasticsearc四种全文检索引擎。
  • whoosh:纯Python编写的全文搜索引擎,虽然性能比不上sphinx、xapian、Elasticsearc等,但是无二进制包,程序不会莫名其妙的崩溃,对于小型的站点,whoosh已经足够使用。
  • jieba:一款免费的中文分词包,如果觉得不好用可以使用一些收费产品。

安装需要的包:

pip3 install django-haystack
pip3 install whoosh
pip3 install jieba

项目名/settings.py(项目配置,注册安装haystack应用,配置whoosh搜索引擎):


INSTALLED_APPS = (
    # ...
    'haystack',  # 安装应用haystack
)

# 配置搜索引擎
HAYSTACK_CONNECTIONS = {
    'default': {
        # 使用whoosh引擎
        # 'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine',  # 对应whoost安装的路径
        'ENGINE': 'haystack.backends.whoosh_cn_backend.WhooshEngine',  # 使用jieba中文分词器
        # 索引文件路径
        'PATH': os.path.join(BASE_DIR, 'whoosh_index'),  # 索引文件的保存路径
    }
}

# 当添加、修改、删除数据时,自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

# 指定搜索结果每页显示的条数 (默认20)
HAYSTACK_SEARCH_RESULTS_PER_PAGE=15

项目名/urls.py(项目路由

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值