php get_headers 超时,PHP实现的带超时功能get_headers函数

PHP实现的带超时功能get_headers函数

发布于 2015-10-13 11:53:52 | 386 次阅读 | 评论: 0 | 来源: 网友投递

PHP开源脚本语言PHP(外文名: Hypertext Preprocessor,中文名:“超文本预处理器”)是一种通用开源脚本语言。语法吸收了C语言、Java和Perl的特点,入门门槛较低,易于学习,使用广泛,主要适用于Web开发领域。PHP的文件后缀名为php。

这篇文章主要介绍了PHP实现的带超时功能的get_headers函数,本文直接给出实现代码,需要的朋友可以参考下

代码比较多,但是比较简单,一眼就看穿的,so,文字尽量少写了。

因为众所周知的网络原因,gavatar也开始越来越慢,写了一个小东西来解决这个问题,过程中遇到了get_headers这个函数,甚是忧伤,记录下来,以免后来人踩坑。

更新记录,函数稍微改了一下,返回值基本和之前序列化后的结果一致,暂时没考虑支持子项也支持数组等(考虑细节性能,还想把没用的http头砍掉….)

需求很简单:获取图片的head信息。

调试程序的时候发现这个函数的调用很缓慢,即使绑定ip,有时候都能蹦到20多秒。

寻思这个事情还是该加个超时吧,但是看官方文档,给出的导出函数接口如下:

代码如下:

array get_headers(string$url[,int$format=0])

你没有看错,这个东西没有超时接口…

上github翻看源码,期望可以用他的底层实现来重新实现一套:

地址 https://github.com/php/php-src/blob/88ca46d92bc1c426e7c7f7313f0fd2b7dcc33cf6/ext/standard/url.c#L710

代码如下:

/* {{{ proto array get_headers(string url[, int format])

fetches all the headers sent by the server in response to a HTTP request */

PHP_FUNCTION(get_headers)

{

char*url;

size_t url_len;

php_stream_context*context;

php_stream*stream;

zval*prev_val,*hdr=NULL,*h;

HashTable*hashT;

zend_long format=0;

if(zend_parse_parameters(ZEND_NUM_ARGS()TSRMLS_CC,"s|l",&url,&url_len,&format)==FAILURE){

return;

}

/** 省略其他一堆... **/

}

/* }}} */

但是很不幸的是,zend_parse_parameters 和 ZEND_NUM_ARGS也都没有PHP版的导出函数。

于是造轮子开始:

代码如下:

functionget_url_headers($url,$timeout=10)

{

$ch=curl_init();

curl_setopt($ch,CURLOPT_URL,$url);

curl_setopt($ch,CURLOPT_HEADER,true);

curl_setopt($ch,CURLOPT_NOBODY,true);

curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);

curl_setopt($ch,CURLOPT_TIMEOUT,$timeout);

$data=curl_exec($ch);

$data=preg_split('/n/',$data);

$data=array_filter(array_map(function($data){

$data=trim($data);

if($data){

$data=preg_split('/:s/',trim($data),2);

$length=count($data);

switch($length){

case2:

returnarray($data[0]=>$data[1]);

break;

case1:

return$data;

break;

default:

break;

}

}

},$data));

sort($data);

foreach($dataas$key=>$value){

$itemKey=array_keys($value)[0];

if(is_int($itemKey)){

$data[$key]=$value[$itemKey];

}elseif(is_string($itemKey)){

$data[$itemKey]=$value[$itemKey];

unset($data[$key]);

}

}

return$data;

}

对比最后结果:

原版又是蛮长的等待,不知道校验啥去了(没继续追代码了,有兴趣的童鞋可以去跟下玩):

代码如下:

Array

(

[0]=>HTTP/1.0302Found

[Accept-Ranges]=>bytes

[Cache-Control]=>max-age=300

[Content-Type]=>Array

(

[0]=>text/html;charset=utf-8

[1]=>text/html;charset=utf-8

)

[Date]=>Array

(

[0]=>Fri,12Dec201415:35:40GMT

[1]=>Fri,12Dec201415:35:43GMT

)

[Expires]=>Fri,12Dec201415:40:40GMT

[Last-Modified]=>Wed,11Jan198408:00:00GMT

[Link]=>; rel="canonical"

[Location]=>http://i2.wp.com/[省略...]

[Server]=>Array

(

[0]=>ECS(oxr/838B)

[1]=>nginx

)

[Source-Age]=>85

[Via]=>1.1varnish

[X-Cache]=>302-HIT

[X-Varnish]=>14702550881470006304

[Content-Length]=>0

[Connection]=>Array

(

[0]=>close

[1]=>close

)

[1]=>HTTP/1.1504Gateway Timeout

)

轮子版返回(瞬间返回,两者内容略有不同,你仔细看就能发现一些有趣的地方了):

代码如下:

Array

(

[0]=>HTTP/1.1302Found

[Accept-Ranges]=>bytes

[Via]=>1.1varnish

[Cache-Control]=>max-age=300

[Server]=>ECS(oxr/838B)

[Content-Type]=>text/html;charset=utf-8

[X-Varnish]=>14702550881470006304

[Date]=>Fri,12Dec201420:31:02GMT

[Location]=>http://i2.wp.com/[省略...]

[Expires]=>Fri,12Dec201420:36:02GMT

[Source-Age]=>85

[Last-Modified]=>Wed,11Jan198408:00:00GMT

[X-Cache]=>302-HIT

[Link]=>; rel="canonical"

[Content-Length]=>0

)

相关阅读:

PHP实现的带超时功能get_headers函数

一个PHP实现的远程图片抓取函数分享

PHP实现的统计数据功能详解

PHP实现数字补零功能的2个函数介绍

PHP实现生成带背景的图形验证码功能

PHP实现的博客欢迎提示功能

php写的带缓存数据功能的mysqli类

php实现的循环创建目录函数

PHP 实现的urldecode函数

php实现的中英数字混排的字符串分割函数

php 实现的获取关键字 去超链接函数

一个php实现的 getsiteurl()函数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值