PHP通过CURL爬取携程特价机票(国内/国际/单程/往返)

第一步先确认要抓取的地方是否是和我的一样(如果是请继续浏览,如果不是请自便)
在这里插入图片描述
确认过眼神,这就是你想要爬取的网页那就往下浏览把
(1)先获取所有的城市列表。
可以自己整理一份,也可以爬取网络上的城市列表。由于爬取过飞猪的城市列表,所以就没爬取携程的。这里我把爬取飞猪城市列表的代码分享一下。大家可以参考。

//获取飞猪的城市列表
        $url = "https://webresource.c-ctrip.com/code/cquery/resource/address/flight/fuzzy_start_poi_timezone_gb2312.js??CR_2016_04_26_00_00_00";
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
        curl_setopt($ch, CURLOPT_HEADER, false);
        curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_REFERER, $url);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
        $result = curl_exec($ch);
        curl_close($ch);
        $city = array();
        preg_match_all('/\((.*?)\)/i',$result,$city);
        $city = $city['1'];
        $city_1 = array();
        foreach ($city as $key=>$value) {
            if (strlen($value) != 3) {
                unset($city[$key]);
            }
        }
        $citys = array_merge($city,$city_1);
        $cityName = array();
        foreach ($citys as $val) {
            $cityName[$val] = $val;
        }

获取到的数据如下
在这里插入图片描述
(2)确认是否获取到了城市列表。获取到了就开始爬取。
我爬取的是 单程/往返 出发地 到 全世界的数据 代码如下

foreach ($cityName as $value) {
            $city = $value;
            $url = 'https://flights.ctrip.com/fuzzy/search';
            $da = '{"inputDepartureCity":"$city","inputDepartureCityName":"null","travelType":"ONEWAY","departStringDate":"任何时间","departDateRanges":[],"maxDays":-1,"minDays":-1,"inputArrivalCities":{"themes":[],"cities":[],"areas":[]},"inputArrivalCitiesMap":{"themes":[],"cities":[],"areas":[],"filter":{}},"isSearchPage":true,"sortingType":"PRICE_ASC","isIncludedTax":true,"city_offset":480}';
            $da = str_replace('$city', $city, $da);
            $ch= curl_init();
            curl_setopt($ch, CURLOPT_URL, $url);
            curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
            curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
            //设置请求头信息 这里是json数据
            curl_setopt($ch, CURLOPT_HTTPHEADER, array('Content-Type: application/json;charset=utf-8'));
            curl_setopt($ch, CURLOPT_ENCODING, 'gzip,deflate');
            curl_setopt($ch, CURLOPT_POST, 1);
            if($da) {
                $da = is_array($da) ? json_encode($da) : $da;
                curl_setopt($ch, CURLOPT_POSTFIELDS, $da);
            }
            curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
            curl_exec($ch);
            $str = curl_exec($ch);
            curl_close($ch);
//            print_r($str);die;
        }

这里便获取到了数据,数据如下
在这里插入图片描述
上面是获取的单程,国内和国际的所有机票信息。想获取往返的只需要将下图的这里改为"ROUNDTRIP"
在这里插入图片描述
第二步将获取的数据进行处理
当然我这里肯定有一份处理好的源码。但是代码过长不方便分享。
友情提示(如何获取携程数据的源码以经分享。如何处理这便靠自己。)
在提示一条(数据里面有国际/国内/包含税费/不包含税费所以处理的时候请认真对照网页上的数据找出规律)
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值