PHP抓取全国省市区数据

这段代码展示了如何利用PHP从京东接口获取全国省市区街道的三级及四级数据,并将其存储到数据库中。通过fid参数递归请求数据,如果请求失败则标记为未完成以便后续重新尝试。程序处理了请求超时和数据解码问题,确保数据完整入库。
摘要由CSDN通过智能技术生成

感谢京东大哥的慷慨解囊

https://fts.jd.com/area/get?fid=4744

4744就是起始值,拿到的就是一级数据(全国各省的数据以及直辖市)
在这里插入图片描述
浏览器是经过编码的,unicode解码就可以看到数据,不过php不需要,直接就可以拿到数据
在这里插入图片描述
前三级的街道,一次性拿到,代码没有写请求失败后的处理,不过将请求失败时候,将complete改为flase,这样子请求完后只需要将为false的重新请求即可

/**
     * [CAN_POST].
     */
    public function address()
    {
        set_time_limit(3600);
        $province = $this->get_address('4744');
        if (false == $province) {
            throw new Exception('一级省份请求失败,fid:4744');
        }
        foreach ($province as $value) {
            if ('海外' == $value['name']) {
                continue;
            }
            $value = (array) $value;
            $province_add_info = [
                'name' => $value['name'],
                'parent_id' => '',
                'level' => 1,
                'order_no' => $value['id'],
                'complete' => true,
            ];

            $province_id = $this->db->default->insert('province_city', $province_add_info);
            $city = $this->get_address($value['id']);
            if (false == $city) {
                $this->db->default->update('province_city', ['_id' => $province_id], ['complete' => false]);
                continue;
            }
            if(empty($city)){
                continue;
            }
            foreach ($city as $value) {
                $value = (array) $value;
                $city_add_info = [
                    'name' => $value['name'],
                    'parent_id' => $province_id,
                    'level' => 2,
                    'order_no' => $value['id'],
                    'complete' => true,
                ];
                $city_id = $this->db->default->insert('province_city', $city_add_info);
                $area = $this->get_address($value['id']);
                if (false == $area) {
                    $this->db->default->update('province_city', ['_id' => $city_id], ['complete' => false]);
                    continue;
                }
                if(empty($area)){
                    continue;
                }
                foreach ($area as $value) {
                    $value = (array) $value;
                    $area_add_info = [
                        'name' => $value['name'],
                        'parent_id' => $city_id,
                        'level' => 3,
                        'order_no' => $value['id'],
                        "complete" => true,
                    ];
                    $this->db->default->insert('province_city', $area_add_info);
                }
            }
        }
    }

拿到第四级街道的数据

    /**
     * [CAN_POST].
     * [NOT_LOG].
     */
    public function get_four_address()
    {
    // 由于默认是超时时间是60s,所以要设置超时时间久一些
        set_time_limit(7200);
        // 拿到第三级的数据
        $area = $this->db->default->get_rows('province_city', ['level' => 3]);
        if(empty($area)){
            throw new Exception("没有第三级数据");
        }
        foreach ($area as $area_info) {
            $street = $this->get_address($area_info['order_no']);
            if (false == $street) {
            // 如果请求失败,就把这一级的complete字段设置为false,下次跑数据就可以直接跳过完成了的
                $this->db->default->update('province_city', ['_id' => $area_info['id']], ['complete' => false]);
                continue;
            }
            if (empty($street)) {
                continue;
            }
            foreach ($street as $value) {
                $value = (array) $value;
                $area_add_info = [
                    'name' => $value['name'],
                    'parent_id' => $area_info['id'],
                    'level' => 4,
                    'order_no' => $value['id'],
                ];
                // 插入数据
                $this->db->default->insert('province_city', $area_add_info);
            }
        }
    }

发起请求,通过传递fid参数来请求拿到下一级的数据

    public function get_address($fid)
    {
    //再次感谢京东,接口开放,直接拿fid发起请求就能拿到数据
        $result = http_get('https://fts.jd.com/area/get?fid='.$fid);
        //php 似乎无法识别数据中的空格字符,本来是数据中作为空格的,但是php需要做一些处理
        $result = str_replace('\ ', ' ', $result);
        $result = json_decode($result, true);
        // 请求失败可能会返回一个{}或者false
        if (!$result || is_object($result)) {
            return false;
        }
        return $result;
    }

拿到的数据,order_no既可以作为排序,也可以作为请求下一级的fid请求参数(比如天津的order_no是3,所以get_address(3)拿到的数据就是天津下一级的区,如果已经是叶子节点了,再往下就是[]空数组)
在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值