python实现小型搜索引擎设计_快播停用都5年了,来试试用Python爬虫做一个自己的私密搜索引擎...

平时我们要搜索某个东西的时候,我们往往会用到百度百科,比如搜“快播”,会出现以下页面:

f6d32e6c9368556d4fdc103f0cf6c8d5.png

快播词条

还有输入“Python”,会出现下面的页面:

4f313b78919c05bfd77a723b41f87567.png

有很多想要学习Python却找不到途径的朋友,我这里整理了一些关于Python的学习资料,从基础到入门到实战都要。有需要的朋友可以关注并私信“01”免费获取...

那么,我们能不能利用爬虫,自己制作一个简单的搜索引擎呢?

Why not?!我们自己制作简单的搜索引擎,展示输入词条的简介部分,这样可以既减少工作量,又展示了该搜索引擎的基本原理。

以下为笔者制作的简单的搜索引擎,实现的功能为:读取输入的词条,并输出百度百科里该词条的简介部分。

16960941e1c7efcf8dc0c9c4f8d0ead5.png

其中search_item为输入词条,进入while循环可一直搜索,当输入为'out'时退出。text为该词条的百度百科简介的网页形式,通过正则表达式将其中的文字提取出来(当然提取后的文字形式还有待美化)。如果百度百科里没有该词条,输出失败信息,并提示测试这将词条具体化些再输入。这样,百度百科有的词条,我们这个搜索引擎里也就有了响应的简介部分。

接下来是测试时间(在Jupyter Notebook上测试):

4986d21c1f942e5fe1141721942ed2b8.png

词条 上海市

看起来还行,就是界面有些简陋,毕竟只是简单的实现以下功能!

452c71f736313fb4a7fbdd918577d215.png

词条 南京 南京市

7f6c692377988438b98912f205b72f17.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值