用Python“追踪”快递

最新推荐文章于 2024-05-11 19:21:01 发布

剑心211

最新推荐文章于 2024-05-11 19:21:01 发布

阅读量587

点赞数

本文链接：https://blog.csdn.net/qq_42680814/article/details/105632463

版权

欢迎加入我们卧虎藏龙的python讨论qq群：996113038

┉┉┉┉┉┉ 『导语』 ┉┉┉┉┉┉

作为一名资深网购者

潇洒哥每星期都要收很多的快递（害)

某宝、某猫、某东、某多都会显示物流

别提多方便了

直到

我在某旧书网上买了本书

非要我下app才告诉我物流

不蒸馒头争口气

我！就！不！下！

就在这时我们的齐老大

仅用了几行代码就查出了快递的状态

嘿嘿从此再也不受气

往下看我们齐老大的操作????

¨¨¨『代码及相关资源获取』¨¨¨

1：关注“python趣味爱好者”公众号，回复“ 查快递 ”获取源代码。

2：加入群聊：996113038。在群文件中下载源代码以及相关资料。

效果演示：

非常适合新人练手啦

往下看详细解说~

开发工具：

python3.6.4

相关第三方库：

requests

json

基本原理：

其实说简单一点，这也是个爬虫，爬取的内容就是快递的信息。我们爬取的网站就是这样的：

https://www.kuaidi100.com

我们主要是根据快递单号来查询我们的快递的位置。

往期精选：

python模仿竹笛演奏《女儿情》

python爬虫批量下载“简谱”

部分代码：

下面，我就给大家简单讲解一下我们的代码，我们把查询快递的操作全部放在了一个类里面。类里面的参数就是“快递单号”。

我们先爬取这个页面的信息。

值得注意的是，我们在初始化的时候生成了一个session对象。这样可以方便接下来的各种操作。

    def __init__(self, post_id):
        self.post_id = post_id
        self.index_url = 'https://www.kuaidi100.com/'
        self.select_url = 'https://www.kuaidi100.com/query'


        self.session = requests.session()
        self.to_index()

当然，作为一个肩负着获取页面信息的类，仅仅有初始化的几个性质还是不行的，我们还需要有获取页面信息的功能，在查询页面信息的时候，我们还需要输入订单号。

    def express(self):
        params = {
            'type': 'zhongtong',  # companyCode
            'postid': self.post_id,  # kuaidiNumber
            'temp': '0.8067971039628283',  # Math.random # 此处混淆随机小数
            'phone': '',  # 可空
        }


        response = self.session.get(self.select_url, headers=self.headers, params=params)
        self.parse(response.text)

大家可以看到，我们的订单号在params里面。params里面存储了好几个信息。有type。也就是快递公司的名称：zhongtong(中通)。还有postid也就是快递单号.......

然后，我们用session里面的get方法获取页面信息。

最终从庞大的数据里面获取我们需要的信息，然后打印出来。就是下面这样。

这就是提取数据的过程。