获取网页状态php,php获取网页请求状态程序示例_PHP教程

对于网页返回状态代码一般情况下我们都会去查自己网站状态码是不是200或错误页面是不是404代码,并且多数情况下我们的查看方法就是使用站长工具或ff浏览器等来查看,极少有人想到自己写一个查看状态代码的功能。

本文就此简述php获取网页请求状态程序示例如下:

方法一,使用 fsockopen(不推荐使用curl_getinfo!)

复制代码 代码如下:

function get_http_code($url=”localhost”, $port=80, $fsock_timeout=10){

set_time_limit(0);

ignore_user_abort(true);

// 记录开始时间

list($usec, $sec) = explode(” “, microtime(true));

$timer[‘start’] = (float)$usec + (float)$sec;

// 校验URL

if(!preg_match(“/^https?:\/\//i”, $url)){

$url = “http://”.$url;

}

// 支持HTTPS

if(preg_match(“/^https:\/\//i”, $url)){

$port = 443;

}

// 解析URL

$urlinfo = parse_url($url);

if(empty($urlinfo[‘path’])){

$urlinfo[‘path’] = ‘/’;

}

$host = $urlinfo[‘host’];

$uri = $urlinfo[‘path’] . (empty($urlinfo[‘query’])?”:$urlinfo[‘query’]);

// 通过fsock打开连接

if(!$fp = fsockopen($host, $port, $errno, $error, $fsock_timeout)){

list($usec, $sec) = explode(” “, microtime(true));

$timer[‘end’] = (float)$usec + (float)$sec;

$usetime = (float)$timer[‘end’] – (float)$timer[‘start’];

return array(‘code’=>-1, ‘usetime’=>$usetime);

}

// 提交请求

$status = socket_get_status($fp);

$out = “GET {$uri} HTTP/1.1\r\n”;

$out .= “Host: {$host}\r\n”;

$out .= “Connection: Close\r\n\r\n”;

$write = fwrite($fp, $out);

if(!$write){

list($usec, $sec) = explode(” “, microtime(true));

$timer[‘end’] = (float)$usec + (float)$sec;

$usetime = (float)$timer[‘end’] – (float)$timer[‘start’];

return array(‘code’=>-2, ‘usetime’=>$usetime);

}

$ret = fgets($fp, 1024);

preg_match(“/http\/\d\.\d\s(\d+)/i”, $ret, $m);

$code = $m[1];

fclose($fp);

list($usec, $sec) = explode(” “, microtime(true));

$timer[‘end’] = (float)$usec + (float)$sec;

$usetime = (float)$timer[‘end’] – (float)$timer[‘start’];

return array(‘code’=>$code, ‘usetime’=>$usetime);

}

file_get_contents 是 fsockopen 功能的简单打包,效率稍低些,但是抓取成功率很高,所以在 snoopy 出问题的时候我一般拿他来用。5.0.0 添加了对 context 的支持,有了context,他也可以发送 header 信息,自定义用户 agent, referer, cookies 都不在话下。5.1.0 添加了 offset 和 maxlen 参数,可以只读文件的一部分内容。

方法二,使用snoopy.class.php

Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。

复制代码 代码如下:

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, ‘http://www.jb51.net/’);

curl_setopt($ch, CURLOPT_RANGE, ‘0-500’);

curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

$result = curl_exec($ch);

curl_close($ch);

echo $result;

$writefn = function($ch, $chunk) {

static $data=”;

static $limit = 500; // 500 bytes, it’s only a test

$len = strlen($data) + strlen($chunk);

if ($len >= $limit ) {

$data .= substr($chunk, 0, $limit-strlen($data));

echo strlen($data) , ‘ ‘, $data;

return -1;

}

$data .= $chunk;

return strlen($chunk);

};

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, ‘http://www.jb51.net/’);

curl_setopt($ch, CURLOPT_RANGE, ‘0-500’);

curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);

curl_setopt($ch, CURLOPT_WRITEFUNCTION, $writefn);

$result = curl_exec($ch);

curl_close($ch);

一些常见的状态码为:

200 – 服务器成功返回网页

404 – 请求的网页不存在

503 – 服务器超时

301 – 页面重定向

www.bkjia.comtrueTechArticle对于网页返回状态代码一般情况下我们都会去查自己网站状态码是不是200或错误页面是不是404代码,并且多数情况下我们的查看方法就是使…

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值