欢迎加入我们卧虎藏龙的python讨论qq群:996113038
┉┉┉┉┉┉ 『导语』 ┉┉┉┉┉┉
作为一名资深网购者
潇洒哥每星期都要收很多的快递(害)
某宝、某猫、某东、某多都会显示物流
别提多方便了
直到
我在某旧书网上买了本书
非要我下app才告诉我物流
不蒸馒头争口气
我!就!不!下!
就在这时我们的齐老大
仅用了几行代码就查出了快递的状态
嘿嘿从此再也不受气
往下看我们齐老大的操作????
¨¨¨『代码及相关资源获取』¨¨¨
1:关注“python趣味爱好者”公众号,回复“ 查快递 ”获取源代码。
2:加入群聊:996113038。在群文件中下载源代码以及相关资料。
效果演示:
非常适合新人练手啦
往下看详细解说~
开发工具:
python3.6.4
相关第三方库:
requests
json
基本原理:
其实说简单一点,这也是个爬虫,爬取的内容就是快递的信息。我们爬取的网站就是这样的:
https://www.kuaidi100.com
我们主要是根据快递单号来查询我们的快递的位置。
往期精选:
部分代码:
下面,我就给大家简单讲解一下我们的代码,我们把查询快递的操作全部放在了一个类里面。类里面的参数就是“快递单号”。
我们先爬取这个页面的信息。
值得注意的是,我们在初始化的时候生成了一个session对象。这样可以方便接下来的各种操作。
def __init__(self, post_id):
self.post_id = post_id
self.index_url = 'https://www.kuaidi100.com/'
self.select_url = 'https://www.kuaidi100.com/query'
self.session = requests.session()
self.to_index()
当然,作为一个肩负着获取页面信息的类,仅仅有初始化的几个性质还是不行的,我们还需要有获取页面信息的功能,在查询页面信息的时候,我们还需要输入订单号。
def express(self):
params = {
'type': 'zhongtong', # companyCode
'postid': self.post_id, # kuaidiNumber
'temp': '0.8067971039628283', # Math.random # 此处混淆随机小数
'phone': '', # 可空
}
response = self.session.get(self.select_url, headers=self.headers, params=params)
self.parse(response.text)
大家可以看到,我们的订单号在params里面。params里面存储了好几个信息。有type。也就是快递公司的名称:zhongtong(中通)。还有postid也就是快递单号.......
然后,我们用session里面的get方法获取页面信息。
最终从庞大的数据里面获取我们需要的信息,然后打印出来。就是下面这样。
这就是提取数据的过程。
无需打开网站
无需被某app胁迫下载
只需要几行代码
然后运行
妈妈再也不用担心我找不到快递啦
本期分享到此结束
很高兴你能看到最后
作者|齐
编辑|潇洒哥
感谢大家观看
有钱的老板可以打赏一下小编哦
扫描下方二维码,关注公众号
参考资料:
参考来源:
https://github.com/wkunzhi/Python3-Spider
图片网址:
https://cdn.pixabay.com