10 分钟 纯 Python 搭建全文搜索引擎

本文介绍了如何在10分钟内使用Python搭建一个全文搜索引擎。通过GitHub上的searx项目,借助Docker容器轻松启动。文章探讨了搜索引擎的工作原理,核心代码主要负责请求后的结果聚合。进一步思考,读者可以自定义返回数据,例如利用爬虫和jieba分词打造个性化搜索体验。
摘要由CSDN通过智能技术生成

10 分钟 纯 Python 搭建全文搜索引擎

# 代码所在

  • Git:https://github.com/asciimoo/searx

官方很贴心,很方便的是已经提供了docker 镜像,基本pull下来就可以很方便的使用了,执行命令

cid=$(sudo docker ps -a | grep searx | awk '{print $1}')
echo searx cid is $cid
if [ "$cid" != "" ];then
sudo docker stop $cidsudo docker rm $cidfisudo docker run -d --name searx -e IMAGE_PROXY=True -e BASE_URL=http://yourdomain.com -p 7777:8888 wonderfall/searx

然后就可以使用了,正常查看docker的状态,就可以正常的使用了

# 思考

怎么样,是不是很方便,我们先看看源码是怎么样实现的

我们打开里面的代码,其实本质就是将request之后的结果做一个大的聚合,至于数据来源,我们可以是来于DB,或者文件,我们可以看一下他的核心代码

from urllib import urlencode
from json import loads
from collections import Iterable
search_url = Non
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值