前段时间尝试做购物商城系统上时候需要用到图片材料,之前有听老师说过可以通过curl获取网站图片,但是没认真 自己用到了才认真去学习。话了一天时间研究京东前端源代码,ok,经研究发现京东图片服务器做的太有规律了,不想拿都不行。首先也许有人会说,不就图片吗,鼠标右击另存为不就行了,至于吗?但是朋友:我十分钟能下载几千张图片,你右击试试。还有人可能会说,这个简单,找个小偷采集器不就行了。是的,小偷采集器是可以拿到图片,但是上平的名称和价格呢?一个购物网站不可能只要图片而已吧。
废话不多说,下面我来盗取一下京东。
function getjd($path,$pagenum){
$url=$path;
$pages=$pagenum;
$arr=explode('-',$url);
for($i=1;$i<=$pages;$i++){//$pages为分页的数量
$arr[14]=$i;//url中最后一个1所在的位置
$url=implode('-',$arr);
$curl = curl_init ();//初始化curl
curl_setopt ( $curl, CURLOPT_URL, $url );
curl_setopt ( $curl, CURLOPT_RETURNTRANSFER, 1 );
curl_setopt($curl, CURLOPT_HEADER, 1);
curl_setopt ( $curl, CURLOPT_POST, 1 );
curl_setopt ( $curl, CURLOPT_POSTFIELDS, $data );
$html = curl_exec ( $curl );//获得页面内容