苏宁、京东物流支持

最近项目中有需要用到京东和苏宁的物流信息,但市场上的第三方接口都是收费的,还就是有些不太稳定,于是一鼓作气写了个“爬虫”,这里做简要说明

语言:php,请求先安装curl扩展
一、苏宁物流
RequestUrl:https://wuliu.suning.com/home/toLogisticsDetail.htm
RequestType:post
RequestData:[‘expressNos’=>$this->expressNo]

$Reqdata = ['expressNos'=>$this->expressNo];
$url = 'https://wuliu.suning.com/home/toLogisticsDetail.htm';
$content = $this->Curl_post($url,$Reqdata);
private function Curl_post($url,$post_data){
	$ch = curl_init();
	curl_setopt($ch, CURLOPT_POST, 1);
	curl_setopt($ch, CURLOPT_HEADER, 0);
	curl_setopt($ch, CURLOPT_URL,$url);
	curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);
	$result = curl_exec($ch);
	$data = str_replace("\"",'"',$result );
	$data = json_decode($data,true);
	return $data;
}

拿到请求的内容,做如下处理

  1. 去掉最外层部分
$content = explode('<ul class="s-waybill-content">',$content)[1];
$content2 = explode('</ul>',$content)[0];
  1. 去掉中心标签的空格,换行,注释等
 $content2 = $this->compress_html($content2);
 private function compress_html($string) {
	$string = str_replace("\r", "", $string);
    $string = str_replace("\r\n", '', $string); //清除换行符
    $string = str_replace("\n", '', $string); //清除换行符
    $string = str_replace("\t", '', $string); //清除制表符
    $pattern = array("/> *([^ ]*) *</","/[\s]+/","/<!--[^!]*-->/","/\" /","/ \"/","'/\*[^*]*\*/'");
    $replace = array(">\\1<"," ","","\"","\"","");
    return preg_replace($pattern, $replace, $string);
}
  1. 继续做处理…,主要是字符截取和替换,正则等
$pattern = '|<span[^>]*>(.*)</span>|isU';
$s = preg_match_all($pattern, $content2, $matches);
$list = array_chunk($matches[1],2);
foreach ($list as $k=>$v) {
	$list[$k]['time'] = $list[$k][0];
	$list[$k]['text'] = $list[$k][1];
	unset($list[$k][0]);
	unset($list[$k][1]);
}
  1. 完成,$list 就是拿到的数据 .

二、京东物流

RequestUrl:https://www.jdwl.com/order/search?waybillCodes=
RequestType:get

$url = 'https://www.jdwl.com/order/search?waybillCodes='.$this->expressNo;
$content = $this->Curl_get($url);
private function Curl_get($url){
	$curl = curl_init();
	curl_setopt($curl, CURLOPT_URL, $url);
	curl_setopt($curl, CURLOPT_HEADER, 1);
	curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
	$data = curl_exec($curl);
	curl_close($curl);
	return $data;
}

拿到请求的内容,做如下处理

  1. 同样去掉最外层部分
$content = explode('<ul class="b-new-search-list">',$content)[1];
$content2 = explode('</ul>',$content)[0];
  1. 去掉干扰项
$content2 = preg_replace("#<i[^>]*>(.*)</i>#isU", "$1", $content2);
$content2 = $this->compress_html($content2);//这个函数在上面有写
  1. 截取所有li标签里的内容
$_li = '|<li[^>]*>(.*)</li>|isU';
$s = preg_match_all($_li, $content2, $li_);
  1. 循环 $li_[1]的内容,时间和内容的处理
$list = [];//数组,存放物流信息
foreach ($li_[1] as &$v) {
	//s1截取所有日期时间点
	$_time = '|<span[^>]*>(.*)</span>|isU';
	preg_match_all($_time, $v, $time_);
	$date = $time_[1][0];//日期
	unset($time_[1][0]);//去掉日期
	$times = $time_[1];//得到当前日期的所有时间点
	//加上日期
	foreach($times as &$vv){
		$vv = $date.' '.$vv;
	}

	//s2截取所有内容
	$_pcon = '|<p[^>]*>(.*)</p>|isU';
	preg_match_all($_pcon, $v, $pcon_);
	$pcons = $pcon_[1];

	//s3时间与内容匹配
	$reslist = ['time'=>$times,'text'=>$pcons];
	$arrs = array();
	foreach ($reslist as $key => $value) {
        array_push($arrs,$reslist[$key]);
      }
	$r = $this->array_merge_more(['time','text'],$arrs);
	foreach ($r as $v1) {
		array_push($list,$v1);
	}
}
//主要是相同长度,相同顺序的2组数组按照key值拼接组合
private function array_merge_more($keys,$arrs){
    // 检查参数是否正确
    if(!$keys || !is_array($keys) || !$arrs || !is_array($arrs) || count($keys)!=count($arrs)){
      return array();
    }
    // 一维数组中最大长度
    $max_len = 0;
    // 整理数据,把所有一维数组转重新索引
    for($i=0,$len=count($arrs); $i<$len; $i++){
      $arrs[$i] = array_values($arrs[$i]);
      if(count($arrs[$i])>$max_len){
        $max_len = count($arrs[$i]);
      }
    }

    // 合拼数据
    $result = array();
    for($i=0; $i<$max_len; $i++){
      $tmp = array();
      foreach($keys as $k=>$v){
        if(isset($arrs[$k][$i])){
          $tmp[$v] = $arrs[$k][$i];
        }
      }
      $result[] = $tmp;
    }
    return $result;
  }
  1. 完成, $list 就是京东物流的列表

贴两张最终的图

京东:vc50979551335
京东结果
苏宁:SN2I00045595658
苏宁结果
总结:这两个是官网上的内容,主要是准确的截取字符串,和对数组的处理
希望这篇文章对你有帮助,如果有疑问,请私信小编
觉得还不错,赞赏一下
赞赏码

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本火锅店点餐系统采用Java语言和Vue技术,框架采用SSM,搭配Mysql数据库,运行在Idea里,采用小程序模式。本火锅店点餐系统提供管理员、用户两种角色的服务。总的功能包括菜品的查询、菜品的购买、餐桌预定和订单管理。本系统可以帮助管理员更新菜品信息和管理订单信息,帮助用户实现在线的点餐方式,并可以实现餐桌预定。本系统采用成熟技术开发可以完成点餐管理的相关工作。 本系统的功能围绕用户、管理员两种权限设计。根据不同权限的不同需求设计出更符合用户要求的功能。本系统中管理员主要负责审核管理用户,发布分享新的菜品,审核用户的订餐信息和餐桌预定信息等,用户可以对需要的菜品进行购买、预定餐桌等。用户可以管理个人资料、查询菜品、在线点餐和预定餐桌、管理订单等,用户的个人资料是由管理员添加用户资料时产生,用户的订单内容由用户在购买菜品时产生,用户预定信息由用户在预定餐桌操作时产生。 本系统的功能设计为管理员、用户两部分。管理员为菜品管理、菜品分类管理、用户管理、订单管理等,用户的功能为查询菜品,在线点餐、预定餐桌、管理个人信息等。 管理员负责用户信息的删除和管理,用户的姓名和手机号都可以由管理员在此功能里看到。管理员可以对菜品的信息进行管理、审核。本功能可以实现菜品的定时更新和审核管理。本功能包括查询餐桌,也可以发布新的餐桌信息。管理员可以查询已预定的餐桌,并进行审核。管理员可以管理公告和系统的轮播图,可以安排活动。管理员可以对个人的资料进行修改和管理,管理员还可以在本功能里修改密码。管理员可以查询用户的订单,并完成菜品的安排。 当用户登录进系统后可以修改自己的资料,可以使自己信息的保持正确性。还可以修改密码。用户可以浏览所有的菜品,可以查看详细的菜品内容,也可以进行菜品的点餐。在本功能里用户可以进行点餐。用户可以浏览没有预定出去的餐桌,选择合适的餐桌可以进行预定。用户可以管理购物车里的菜品。用户可以管理自己的订单,在订单管理界面里也可以进行查询操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值