一般情况下,我们都是设置CURLOPT_HEADER 为false
但是,当我们不知道是否登陆成功的时候,我们设置CURLOPT_HEADER 为true,返回内容中就会包含头内容的输出,如下:
HTTP/1.1 302 Found | |
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0 | |
Content-Type: text/html | |
Date: Wed, 03 Feb 2016 10:01:28 GMT | |
Expires: Thu, 19 Nov 1981 08:52:00 GMT | |
Location: http://partners.vcommission.com/publisher/ | |
Pragma: no-cache | |
Server: Apache | |
Content-Length: 0 | |
Connection: keep-alive |
2016-2-3日,用curl爬取某个网站,返回信息如下:
乍一看,以为是爬取失败,知道用CURLOPT_HEADER 输出返回头信息,才知道,已经爬取成功。显示如上报错的原因是,CURL无法加载JS,而对方网站的很多东西是js写的,所以curl登陆失败的假象。