CURLOPT_HEADER 不可小觑的作用

一般情况下,我们都是设置CURLOPT_HEADER 为false

但是,当我们不知道是否登陆成功的时候,我们设置CURLOPT_HEADER 为true,返回内容中就会包含头内容的输出,如下:



HTTP/1.1 302 Found
 Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
 Content-Type: text/html
 Date: Wed, 03 Feb 2016 10:01:28 GMT
 Expires: Thu, 19 Nov 1981 08:52:00 GMT
 Location: http://partners.vcommission.com/publisher/
 Pragma: no-cache
 Server: Apache
 Content-Length: 0
 Connection: keep-alive 
返回代码302,代表重定向,location属性后面接的是重定向的网址。这种种返回的头信息都表明,登陆已经成功。

2016-2-3日,用curl爬取某个网站,返回信息如下:







乍一看,以为是爬取失败,知道用CURLOPT_HEADER 输出返回头信息,才知道,已经爬取成功。显示如上报错的原因是,CURL无法加载JS,而对方网站的很多东西是js写的,所以curl登陆失败的假象。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值