php get_headers 超时,PHP实现的带超时功能get_headers函数

代码比较多,但是比较简单,一眼就看穿的,so,文字尽量少写了。因为众所周知的网络原因,gavatar也开始越来越慢,写了一个小东西来解决这个问题,过程中遇到了get_headers这个函数,甚是忧伤,记录下来,以免后来人踩坑。更新记录,函数稍微改了一下,返回值基本和之前序列化后的结果一致,暂时没考虑支持子项也支持数组等(考虑细节性能,还想把没用的http头砍掉….)需求很简单:获取图片的head信息。调试程序的时候发现这个函数的调用很缓慢,即使绑定ip,有时候都能蹦到20多秒。寻思这个事情还是该加个超时吧,但是看官方文档,给出的导出函数接口如下:复制代码 代码如下:array get_headers(string$url[,int$format=0])你没有看错,这个东西没有超时接口…上github翻看源码,期望可以用他的底层实现来重新实现一套:地址 https://github.com/php/php-src/blob/88ca46d92bc1c426e7c7f7313f0fd2b7dcc33cf6/ext/standard/url.c#L710

复制代码 代码如下:/* {{{ proto array get_headers(string url[, int format])   fetches all the headers sent by the server in response to a HTTP request */PHP_FUNCTION(get_headers){char*url;size_t url_len;php_stream_context*context;php_stream*stream;zval*prev_val,*hdr=NULL,*h;HashTable*hashT;zend_long format=0;                if(zend_parse_parameters(ZEND_NUM_ARGS()TSRMLS_CC,"s|l",&url,&url_len,&format)==FAILURE){return;} /** 省略其他一堆... **/}/* }}} */

但是很不幸的是,zend_parse_parameters 和 ZEND_NUM_ARGS也都没有PHP版的导出函数。于是造轮子开始:复制代码 代码如下:functionget_url_headers($url,$timeout=10){    $ch=curl_init();     curl_setopt($ch,CURLOPT_URL,$url);    curl_setopt($ch,CURLOPT_HEADER,true);    curl_setopt($ch,CURLOPT_NOBODY,true);    curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);    curl_setopt($ch,CURLOPT_TIMEOUT,$timeout);     $data=curl_exec($ch);    $data=preg_split("//",$data);     $data=array_filter(array_map(function($data){        $data=trim($data);        if($data){            $data=preg_split("/:s/",trim($data),2);            $length=count($data);            switch($length){                case2:                    returnarray($data[0]=>$data[1]);                    break;                case1:                    return$data;                    break;                default:                    break;            }        }    },$data));     sort($data);     foreach($dataas$key=>$value){        $itemKey=array_keys($value)[0];        if(is_int($itemKey)){            $data[$key]=$value[$itemKey];        }elseif(is_string($itemKey)){            $data[$itemKey]=$value[$itemKey];            unset($data[$key]);        }    }     return$data;}

对比最后结果:原版又是蛮长的等待,不知道校验啥去了(没继续追代码了,有兴趣的童鞋可以去跟下玩):

复制代码 代码如下:Array(    [0]=>HTTP/1.0302Found    [Accept-Ranges]=>bytes    [Cache-Control]=>max-age=300    [Content-Type]=>Array        (            [0]=>text/html;charset=utf-8            [1]=>text/html;charset=utf-8        )     [Date]=>Array        (            [0]=>Fri,12Dec201415:35:40GMT            [1]=>Fri,12Dec201415:35:43GMT        )     [Expires]=>Fri,12Dec201415:40:40GMT    [Last-Modified]=>Wed,11Jan198408:00:00GMT    [Link]=>; rel="canonical"    [Location]=>http://i2.wp.com/[省略...]    [Server]=>Array        (            [0]=>ECS(oxr/838B)            [1]=>nginx        )     [Source-Age]=>85    [Via]=>1.1varnish    [X-Cache]=>302-HIT    [X-Varnish]=>14702550881470006304    [Content-Length]=>0    [Connection]=>Array        (            [0]=>close            [1]=>close        )     [1]=>HTTP/1.1504Gateway Timeout)

轮子版返回(瞬间返回,两者内容略有不同,你仔细看就能发现一些有趣的地方了):

复制代码 代码如下:Array(    [0]=>HTTP/1.1302Found    [Accept-Ranges]=>bytes    [Via]=>1.1varnish    [Cache-Control]=>max-age=300    [Server]=>ECS(oxr/838B)    [Content-Type]=>text/html;charset=utf-8    [X-Varnish]=>14702550881470006304    [Date]=>Fri,12Dec201420:31:02GMT    [Location]=>http://i2.wp.com/[省略...]    [Expires]=>Fri,12Dec201420:36:02GMT    [Source-Age]=>85    [Last-Modified]=>Wed,11Jan198408:00:00GMT    [X-Cache]=>302-HIT    [Link]=>; rel="canonical"    [Content-Length]=>0)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值