利用flask构造爬虫接口(python初级)

本文介绍了如何使用Python的Flask框架创建一个简单的爬虫接口,该接口可供其他语言调用。通过分析http://qq.ip138.com/idsearch/index.asp?网站,我们可以抓取身份证查询的归属地信息。利用正则表达式提取所需数据,并通过Flask设置路由,实现接口的调用。在Python3环境中,通过Postman测试接口,展示请求结果。
摘要由CSDN通过智能技术生成

爬虫很多时候除了能够做成项目在服务器上跑以外,还可以做成接口的形式够其他语言调用,即爬虫可以实时的镶嵌到app,web或者其他场景下,当有客户调用时就会启动,无人调用时,就静静的待着。下面说一下利用python中的flask框架来写一个简单的爬虫来供其他语言调用。初级入门很简单的web框架和爬虫之间的结合应用。如果有其他的应用需求,请自行研究。

首先,导包不解释了,自行安装flask就可以了。

然后实例化一个flask对象:

然后写我们的爬虫方法,这里我们以 http://qq.ip138.com/idsearch/index.asp?为例,一个输入身份证便可以查询归属地的网址。

首先我们需要分析这个网页构造,来确定我们的爬虫该怎么写。

 

我们查看网页源代码,发现我们想要的归属地的信息就在源码中,所以我们利用正则就很方便的取出归属地。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值