php 请求 响应,PHP 取得服务器响应一个 HTTP 请求所发送的所有标头

用户评论:

Backslider (2012-02-15 19:06:56)

It should be noted that rather than returning "false" on failure, this function (and others) return a big phat WARNING that will halt your script in its tracks if you do not have error reporting /warning turned off.

Thats just insane! Any function that does something like fetch a URL should simply return false, without a warning, if the URL fails for whatever reason other than it is badly formatted.

damolp at hotmail dot com (2011-07-03 17:43:51)

I found that this function is the slowest in obtaining the headers of a page probably because it uses a GET request rather then a HEAD request. Over 10,000,000 trials of obtaining the headers of a page from a server i found the following (results in seconds).

cURL: Mean: 0.584127946. Sigma: 0.050581736.

fsocketopen: Mean: 0.622114251. Sigma: 0.263170424.

get_headers: Mean: 0.90375551. Sigma: 0.273823419.

cURL was the fastest with fsocketopens being the second fastest. I noticed as well that fsocketopen had some outliers where as cURL did not.

Lukas Najduk (2011-01-11 03:36:50)

Unfortunately there is still no useful output format to handle redirects.

This function will bring all non-broken headers into a usable format. Too bad it has to call the get_headers() funtion 2 times, but i dont see any other possibility right now.

if (empty($headers)) {

return array();

}$splitmarks= array();

foreach ($headersas$key=>$h) {

if (is_numeric($key)) {array_push($splitmarks,$h);

}

}// get the "real" headers$headers_final= array();$i=0;$headers=get_headers($crawl_uri);

foreach ($headersas$head) {// if the value is one of the splitmarks, start the next headerif (array_key_exists($i,$splitmarks) &&$head===$splitmarks[$i]) {$i++;

}

else {// get the headers name$tmp=explode(": ",$head,2);// check if the header is already existing, if yes, parse the similar header to an arrayif (!empty($headers_final[$i-1][$tmp[0]])) {

if (is_array($headers_final[$i-1][$tmp[0]])) {array_push($headers_final[$i-1][$tmp[0]],$tmp[1]);

}

else {$headers_final[$i-1][$tmp[0]] = array($headers_final[$i-1][$tmp[0]],$tmp[1]);

}

}

else {$headers_final[$i-1][$tmp[0]] =$tmp[1];

}

}

}

return$headers_final;

}?>

Weboide (2010-09-25 18:13:47)

Note that get_headers **WILL follow redirections** (HTTP redirections). New headers will be appended to the array if $format=0. If $format=1 each redundant header will be an array of multiple values, one for each redirection.

For example:

$url='http://google.com';var_dump(get_headers($url,0));/*array(18) {

[0]=>  string(30) "HTTP/1.0 301 Moved Permanently"

[1]=>  string(32) "Location: http://www.google.com/"

[2]=>  string(38) "Content-Type: text/html; charset=UTF-8"

[3]=>  string(35) "Date: Sun, 26 Sep 2010 00:59:50 GMT"

[4]=>  string(38) "Expires: Tue, 26 Oct 2010 00:59:50 GMT"

[5]=>  string(38) "Cache-Control: public, max-age=2592000"

....

string(15) "HTTP/1.0 200 OK"

[10]=>  string(35) "Date: Sun, 26 Sep 2010 00:59:51 GMT"

[11]=>  string(11) "Expires: -1"

[12]=>  string(33) "Cache-Control: private, max-age=0"

.....

}*/

/*===========================*/var_dump(get_headers($url,1));/*array(11) {

[0]=>

string(30) "HTTP/1.0 301 Moved Permanently"

["Location"]=>  string(22) "http://www.google.com/"

["Content-Type"]=>  array(2) {

[0]=>    string(24) "text/html; charset=UTF-8"

[1]=>    string(29) "text/html; charset=ISO-8859-1"

}

["Date"]=>  array(2) {

[0]=>    string(29) "Sun, 26 Sep 2010 01:03:39 GMT"

[1]=>    string(29) "Sun, 26 Sep 2010 01:03:39 GMT"

}

["Expires"]=>  array(2) {

[0]=>    string(29) "Tue, 26 Oct 2010 01:03:39 GMT"

[1]=>    string(2) "-1"

}

["Cache-Control"]=>  array(2) {

[0]=>    string(23) "public, max-age=2592000"

[1]=>    string(18) "private, max-age=0"

}

.....

}*/?>

nick at innovaweb dot co dot uk (2010-05-02 17:28:29)

Seems like there are some people who are looking for only the 3-digit HTTP response code  - here is a quick and nasty solution:

returnsubstr($headers[0],9,3);

}?>

How easy is that? Echo the function containing the URL you want to check the response code for, and voilà. Custom redirects, alternative for blocked is_file() or flie_exists() functions (like I seem to have on my servers) hence the cheap workaround. But hey - it works!

Pudding

php at hm2k dot org (2010-01-28 10:20:25)

* Fetches all the real headers sent by the server in response to a HTTP request without redirects

*

* @link      http://php.net/function.get_headers

* @link      http://bugs.php.net/bug.php?id=50719

*/functionget_real_headers($url,$format=0,$follow_redirect=0) {

if (!$follow_redirect) {//set new default options$opts= array('http'=>

array('max_redirects'=>1,'ignore_errors'=>1)

);stream_context_get_default($opts);

}//get headers$headers=get_headers($url,$format);//restore default optionsif (isset($opts)) {$opts= array('http'=>

array('max_redirects'=>20,'ignore_errors'=>0)

);stream_context_get_default($opts);

}//returnreturn$headers;

}?>

gabe at vtunnel dot com (2009-04-22 01:23:51)

In some cases, you don't want get_headers to follow redirects. For example, some of my servers can access a particular website, which sends a redirect header. The site it is redirected to, however, has me firewalled. I need to take the 302 redirected url, and do something to it to give me a new url that I *can* connect to.

The following will give you output similar to get_headers, except it has a timeout, and it doesn't follow redirects:

{$ch=curl_init();curl_setopt($ch,CURLOPT_URL,$url);curl_setopt($ch,CURLOPT_HEADER,true);curl_setopt($ch,CURLOPT_NOBODY,true);curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);curl_setopt($ch,CURLOPT_TIMEOUT,15);$r=curl_exec($ch);$r=split("\n",$r);

return$r;

}

Ifyoudowant to follow redirects,you candosomething like this:$go=1;$i=1;

while ($go&&$i<6)

{$headers=get_headers_curl($url);$go=getNextLocation($headers);

if ($go)

{$url=modifyUrl($go);

}$i++;

}

functiongetNextLocation($headers)

{$array=$headers;$count=count($array);

for ($i=0;$i

{

if (strpos($array[$i],"ocation:"))

{$url=substr($array[$i],10);

}

}

if ($url)

{

return$url;

}

else

{

return0;

}

}?>

info at marc-gutt dot de (2008-06-21 05:04:49)

Should be the same than the original get_headers():

functionget_headers($url,$format=0) {$headers= array();$url=parse_url($url);$host= isset($url['host']) ?$url['host'] :'';$port= isset($url['port']) ?$url['port'] :80;$path= (isset($url['path']) ?$url['path'] :'/') . (isset($url['query']) ?'?'.$url['query'] :'');$fp=fsockopen($host,$port,$errno,$errstr,3);

if ($fp)

{$hdr="GET$pathHTTP/1.1\r\n";$hdr.="Host:$host\r\n";$hdr.="Connection: Close\r\n\r\n";fwrite($fp,$hdr);

while (!feof($fp) &&$line=trim(fgets($fp,1024)))

{

if ($line=="\r\n") break;

list($key,$val) =explode(': ',$line,2);

if ($format)

if ($val)$headers[$key] =$val;

else$headers[] =$key;

else$headers[] =$line;

}fclose($fp);

return$headers;

}

returnfalse;

}

}?>

php dot sirlancelot at spamgourmet dot com (2008-06-05 13:59:32)

I tried to replicate the native behavior as much as possible for systems that don't have the get_headers() function. Here it is:

functionget_headers($Url,$Format=0,$Depth=0) {

if ($Depth>5) return;$Parts=parse_url($Url);

if (!array_key_exists('path',$Parts))$Parts['path'] ='/';

if (!array_key_exists('port',$Parts))$Parts['port'] =80;

if (!array_key_exists('scheme',$Parts))$Parts['scheme'] ='http';$Return= array();$fp=fsockopen($Parts['host'],$Parts['port'],$errno,$errstr,30);

if ($fp) {$Out='GET '.$Parts['path'].(isset($Parts['query']) ?'?'.@$Parts['query'] :'')." HTTP/1.1\r\n".'Host: '.$Parts['host'].($Parts['port'] !=80?':'.$Parts['port'] :'')."\r\n".'Connection: Close'."\r\n";fwrite($fp,$Out."\r\n");$Redirect=false;$RedirectUrl='';

while (!feof($fp) &&$InLine=fgets($fp,1280)) {

if ($InLine=="\r\n") break;$InLine=rtrim($InLine);

list($Key,$Value) =explode(': ',$InLine,2);

if ($Key==$InLine) {

if ($Format==1)$Return[$Depth] =$InLine;

else$Return[] =$InLine;

if (strpos($InLine,'Moved') >0)$Redirect=true;

} else {

if ($Key=='Location')$RedirectUrl=$Value;

if ($Format==1)$Return[$Key] =$Value;

else$Return[] =$Key.': '.$Value;

}

}fclose($fp);

if ($Redirect&& !empty($RedirectUrl)) {$NewParts=parse_url($RedirectUrl);

if (!array_key_exists('host',$NewParts))$RedirectUrl=$Parts['host'].$RedirectUrl;

if (!array_key_exists('scheme',$NewParts))$RedirectUrl=$Parts['scheme'].'://'.$RedirectUrl;$RedirectHeaders=get_headers($RedirectUrl,$Format,$Depth+1);

if ($RedirectHeaders)$Return=array_merge_recursive($Return,$RedirectHeaders);

}

return$Return;

}

returnfalse;

}}?>The function will handle up to five redirects.

Enjoy!

dxtrim at yahoo dot com (2008-01-17 01:16:11)

Content-Type returns a value depending only on the extension and not the real MIME TYPE.

So, bad_file.exe renamed to good_file.doc will return application/msword

A file without extension returns a 404.

(2006-11-13 00:29:21)

I've noticed it.

Some Server will simply return the false reply header if you sent 'HEAD' request instead of 'GET'. The 'GET' request header always receiving the most actual HTTP header instead of 'HEAD' request header. But If you don't mind for a fast but risky method then 'HEAD' request is better for you.

btw ... this is get header with additional information such as User, Pass & Refferer. ...

if (!empty($user)) {$authentification=base64_encode($user.':'.$pass);$authline="Authorization: Basic$authentification\r\n";

}

if (!empty($referer)) {$refererline="Referer:$referer\r\n";

}$url_info=parse_url($url);$port= isset($url_info['port']) ?$url_info['port'] :80;$fp=fsockopen($url_info['host'],$port,$errno,$errstr,30);

if($fp) {$head="GET ".@$url_info['path']."?".@$url_info['query']." HTTP/1.0\r\n";

if (!empty($url_info['port'])) {$head.="Host: ".@$url_info['host'].":".$url_info['port']."\r\n";

} else {$head.="Host: ".@$url_info['host']."\r\n";

}$head.="Connection: Close\r\n";$head.="Accept: */*\r\n";$head.=$refererline;$head.=$authline;$head.="\r\n";fputs($fp,$head);

while(!feof($fp) or ($eoheader==true)) {

if($header=fgets($fp,1024)) {

if ($header=="\r\n") {$eoheader=true;

break;

} else {$header=trim($header);

}

if($format==1) {$key=array_shift(explode(':',$header));

if($key==$header) {$headers[] =$header;

} else {$headers[$key]=substr($header,strlen($key)+2);

}

unset($key);

} else {$headers[] =$header;

}

}

}

return$headers;

} else {

returnfalse;

}

}?>

Regards.

Donovan

(2006-05-10 04:10:17)

If you want to get headers that current PHP process is going to send back to browser, see headers_list()

stuart at sixletterwords dot com (2005-09-14 12:52:41)

hey, i came across this afew weeks ago and used the function in an app for recording info about domains that my company owns, and found that the status this returns was wrong most of the time (400 bad request or void for sites that were clearly online). then looking into it i noticed the problem was that it wasn't able to get the correct info about sites with redirections. but thats not the full problem because everything on my server was returning the wrong status too. i searched around on php.net for other info and found that fsockopen's example worked better and only needed some tweeking.

heres the function i put together from it and a small change.

functionget_headers($url,$format=0,$httpn=0){$fp=fsockopen($url,80,$errno,$errstr,30);

if ($fp) {$out="GET / HTTP/1.1\r\n";$out.="Host:$url\r\n";$out.="Connection: Close\r\n\r\n";fwrite($fp,$out);

while (!feof($fp)) {$var.=fgets($fp,1280);

}$var=explode("

return$var;

}

}

}?>

this returns an array of the header (only problem being that if the site doesn't have correct html it'll pull in some content too).

hope this'll help someone else.

sey at sey dot prometheus-designs dot net (2005-07-27 16:10:38)

The replacement updated get_headers function by aeontech at gmail dot com improperly formats dates when $format = 1.

Replace:

else {

$headers[strtolower($h2[0])] = trim($h2[1]);

}

?>

With:

else {

$foo = implode( ':', $h2 );

$foo = preg_replace( '/[a-zA-Z- ]*: /', '', $foo );

$headers[strtolower($h2[0])] = trim( $foo );

}

drfickle2 at yahoo dot com (2005-07-27 05:01:07)

aeontech, this the below change adds support for SSL connections. Thanks for the code!

if (isset($url_info['scheme']) && $url_info['scheme'] == 'https') {

$port = 443;

$fp=fsockopen('ssl://'.$url_info['host'], $port, $errno, $errstr, 30);

} else {

$port = isset($url_info['port']) ? $url_info['port'] : 80;

$fp=fsockopen($url_info['host'], $port, $errno, $errstr, 30);

}

(2005-07-15 13:37:21)

For anyone reading the previous comments, here is code that takes into account all the previous suggestions and includes a bugfix, too.

This code basically provides the "get_headers" function even on systems that are not running PHP 5.0.  It uses strtolower() on the keys, as suggested.  It uses the $h2 array instead of the $key, as suggested.  It removes a line about unsetting the $key -- no reason to unset something which is no longer used.  And I've changed the status header to be named "status" (instead of "0") in the array.  Note that if more than one header is returned without a label, they'll be stuck in "status" -- but I think status is the only header that comes back without a label, so it works for me.  So, first the code, then a sample of the usage:

* @return array

* @param string $url

* @param int $format

* @desc Fetches all the headers

* @author cpurruc fh-landshut de

* @modified by dotpointer

* @modified by aeontech

*/functionget_headers($url,$format=0) {$url_info=parse_url($url);$port= isset($url_info['port']) ?$url_info['port'] :80;$fp=fsockopen($url_info['host'],$port,$errno,$errstr,30);

if($fp) {$head="HEAD ".@$url_info['path']."?".@$url_info['query'];$head.=" HTTP/1.0\r\nHost: ".@$url_info['host']."\r\n\r\n";fputs($fp,$head);

while(!feof($fp)) {

if($header=trim(fgets($fp,1024))) {

if($format==1) {$h2=explode(':',$header);// the first element is the http header type, such as HTTP/1.1 200 OK,

// it doesn't have a separate name, so we have to check for it.if($h2[0] ==$header) {$headers['status'] =$header;

}

else {$headers[strtolower($h2[0])] =trim($h2[1]);

}

}

else {$headers[] =$header;

}

}

}

return$headers;

}

else {

returnfalse;

}

}

}?>

OK?  Here's the usage:

$response=get_headers('http://www.example.com/',1);

if (!$response) {

echo'Unable to initiate connection.';

}

else {print_r($response);

}?>

Chortos-2 (2005-06-03 02:44:26)

aeontech, I'd edit your function a little... How about replacing this:

$key = array_shift(explode(':',$header));

// the first element is the http header type, such as HTTP 200 OK,

// it doesn't have a separate name, so we have to check for it.

if($key == $header)

{

$headers[] = $header;

}

else

{

$headers[$key]=substr($header,strlen($key)+2);

}

?>

with this:

$h2 = explode(':',$header);

// the first element is the http header type, such as HTTP/1.1 200 OK,

// it doesn't have a separate name, so we have to check for it.

if($h2[0] == $header)

{

$headers[] = $header;

}

else

{

$headers[ $h2[0] ] = trim($h2[1]);

}

?>

I think it looks a bit nicer :)

david at nothisbit dot futuresbright dot com (2005-04-05 04:03:03)

After discovering that some webservers reply with "Content-Type" and others with "Content-type" I modified the function below to use strtolower($key) to make for easy checking against these case differences.

aeontech at gmail dot com (2004-12-23 17:20:18)

In response to dotpointer's modification of Jamaz' solution...

Here is a small modification of your function, this adds the emulation of the optional $format parameter.

* @return array

* @param string $url

* @param int $format

* @desc Fetches all the headers

* @author cpurruc fh-landshut de

* @modified by dotpointer

* @modified by aeontech

*/functionget_headers($url,$format=0)

{$url_info=parse_url($url);$port= isset($url_info['port']) ?$url_info['port'] :80;$fp=fsockopen($url_info['host'],$port,$errno,$errstr,30);

if($fp)

{$head="HEAD ".@$url_info['path']."?".@$url_info['query']." HTTP/1.0\r\nHost: ".@$url_info['host']."\r\n\r\n";fputs($fp,$head);

while(!feof($fp))

{

if($header=trim(fgets($fp,1024)))

{

if($format==1)

{$key=array_shift(explode(':',$header));// the first element is the http header type, such as HTTP 200 OK,

// it doesn't have a separate name, so we have to check for it.if($key==$header)

{$headers[] =$header;

}

else

{$headers[$key]=substr($header,strlen($key)+2);

}

unset($key);

}

else

{$headers[] =$header;

}

}

}

return$headers;

}

else

{

returnfalse;

}

}

}?>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值