php fsockopen 代理,发布一个用PHP fsockopen写的HTTP下载的类

发布一个用PHP fsockopen写的HTTP下载的类

更新时间:2007年02月22日 00:00:00   作者:

如果支持打开远程内容的选项的话,实际上php用fopen或file_get_contents都能获得一个网页的内容,但是默认的函数有个不足的地方就是无法获取HTTP头,这在一些特殊的应用中很不方便,如,有一个链接:

http://www.abc.com/showvd.asp?id=18

假如它返回的是一个图片,用默认函数就很难识别,但如果通过HTTP应答头来判断就简单多了,此外如果对方通过 Refer 来防盗链的话,也是无法获取的,用HTTP类就能完美解决这些问题,而且速度也相差无几。

使用方法:

$hd = new DedeHttpDown();

$hd->OpenUrl("http://www.dedecms.com");

echo $hd->GetHtml();

//如果保存为文件则用 $hd->SaveBin("dede.html");

$hd->Close();

获得http请求头用

$hd->GetHead("key")

设置请求头

$hd->SetHead(key,value); (必须在调用 OpenUrl 之前设定)

代码如下:

/* ---------------------------------------------------------------------

//织梦Http下载类V1.0

//出自:织梦之旅 http://www.dedecms.com

//作者: IT柏拉图

//时间: 2005-11-13 12:39

//声明: 首发在落伍者网站,转载请保留版权信息

--------------------------------------------------------------------- */

class DedeHttpDown

{

var $m_url = "";

var $m_urlpath = "";

var $m_scheme = "http";

var $m_host = "";

var $m_port = "80";

var $m_user = "";

var $m_pass = "";

var $m_path = "/";

var $m_query = "";

var $m_fp = "";

var $m_error = "";

var $m_httphead = "" ;

var $m_html = "";

var $m_puthead = "";

var $BaseUrlPath = "";

var $HomeUrl = "";

var $JumpCount = 0;//防止多重重定向陷入死循环

//

//初始化系统

//

function PrivateInit($url)

{

if($url=="") return ;

$urls = "";

$urls = @parse_url($url);

$this->m_url = $url;

if(is_array($urls))

{

$this->m_host = $urls["host"];

if(!empty($urls["scheme"])) $this->m_scheme = $urls["scheme"];

if(!empty($urls["user"])){

$this->m_user = $urls["user"];

}

if(!empty($urls["pass"])){

$this->m_pass = $urls["pass"];

}

if(!empty($urls["port"])){

$this->m_port = $urls["port"];

}

if(!empty($urls["path"])) $this->m_path = $urls["path"];

$this->m_urlpath = $this->m_path;

if(!empty($urls["query"])){

$this->m_query = $urls["query"];

$this->m_urlpath .= "?".$this->m_query;

}

$this->HomeUrl = $urls["host"];

$this->BaseUrlPath = $this->HomeUrl.$urls["path"];

$this->BaseUrlPath = ereg_replace("/([^/]*)\.(.*)$","/",$this->BaseUrlPath);

$this->BaseUrlPath = ereg_replace("/$","",$this->BaseUrlPath);

}

}

//

//打开指定网址

//

function OpenUrl($url)

{

//重设各参数

$this->m_url = "";

$this->m_urlpath = "";

$this->m_scheme = "http";

$this->m_host = "";

$this->m_port = "80";

$this->m_user = "";

$this->m_pass = "";

$this->m_path = "/";

$this->m_query = "";

$this->m_error = "";

$this->JumpCount = 0;

$this->m_httphead = Array() ;

//$this->m_puthead = "";

$this->m_html = "";

$this->Close();

//初始化系统

$this->PrivateInit($url);

$this->PrivateStartSession();

}

//

//打开303重定向网址

//

function JumpOpenUrl($url)

{

//重设各参数

$this->m_url = "";

$this->m_urlpath = "";

$this->m_scheme = "http";

$this->m_host = "";

$this->m_port = "80";

$this->m_user = "";

$this->m_pass = "";

$this->m_path = "/";

$this->m_query = "";

$this->m_error = "";

$this->JumpCount++;

$this->m_httphead = Array() ;

$this->m_html = "";

$this->Close();

//初始化系统

$this->PrivateInit($url);

$this->PrivateStartSession();

}

//

//获得某操作错误的原因

//

function printError()

{

echo "错误信息:".$this->m_error;

echo "具体返回头:
";

foreach($this->m_httphead as $k=>$v)

{ echo "$k => $v 
\r\n"; }

}

//

//判别用Get方法发送的头的应答结果是否正确

//

function IsGetOK()

{

if( ereg("^2",$this->GetHead("http-state")) )

{        return true; }

else

{

$this->m_error .= $this->GetHead("http-state")." - ".$this->GetHead("http-describe")."
";

return false;

}

}

//

//看看返回的网页是否是text类型

//

function IsText()

{

if(ereg("^2",$this->GetHead("http-state"))

&& eregi("^text",$this->GetHead("content-type")))

{        return true; }

else

{

$this->m_error .= "内容为非文本类型或网址重定向
";

return false;

}

}

//

//判断返回的网页是否是特定的类型

//

function IsContentType($ctype)

{

if(ereg("^2",$this->GetHead("http-state"))

&& $this->GetHead("content-type")==strtolower($ctype))

{        return true; }

else

{

$this->m_error .= "类型不对 ".$this->GetHead("content-type")."
";

return false;

}

}

//

//用Http协议下载文件

//

function SaveToBin($savefilename)

{

if(!$this->IsGetOK()) return false;

if(@feof($this->m_fp)) { $this->m_error = "连接已经关闭!"; return false; }

$fp = fopen($savefilename,"w");

while(!feof($this->m_fp)){

fwrite($fp,fread($this->m_fp,1024));

}

fclose($this->m_fp);

fclose($fp);

return true;

}

//

//保存网页内容为Text文件

//

function SaveToText($savefilename)

{

if($this->IsText()) $this->SaveBinFile($savefilename);

else return "";

}

//

//用Http协议获得一个网页的内容

//

function GetHtml()

{

if(!$this->IsText()) return "";

if($this->m_html!="") return $this->m_html;

if(!$this->m_fp||@feof($this->m_fp)) return "";

while(!feof($this->m_fp)){

$this->m_html .= fgets($this->m_fp,256);

}

@fclose($this->m_fp);

return $this->m_html;

}

//

//开始HTTP会话

//

function PrivateStartSession()

{

if(!$this->PrivateOpenHost()){

$this->m_error .= "打开远程主机出错!";

return false;

}

if($this->GetHead("http-edition")=="HTTP/1.1") $httpv = "HTTP/1.1";

else $httpv = "HTTP/1.0";

//发送固定的起始请求头GET、Host信息

fputs($this->m_fp,"GET ".$this->m_urlpath." $httpv\r\n");

$this->m_puthead["Host"] = $this->m_host;

//发送用户自定义的请求头

if(!isset($this->m_puthead["Accept"])) { $this->m_puthead["Accept"] = "*/*"; }

if(!isset($this->m_puthead["User-Agent"])) { $this->m_puthead["User-Agent"] = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2)"; }

if(!isset($this->m_puthead["Refer"])) { $this->m_puthead["Refer"] = "http://".$this->m_puthead["Host"]; }

foreach($this->m_puthead as $k=>$v){

$k = trim($k);

$v = trim($v);

if($k!=""&&$v!=""){

fputs($this->m_fp,"$k: $v\r\n");

}

}

//发送固定的结束请求头

//HTTP1.1协议必须指定文档结束后关闭链接,否则读取文档时无法使用feof判断结束

if($httpv=="HTTP/1.1") fputs($this->m_fp,"Connection: Close\r\n\r\n");

else fputs($this->m_fp,"\r\n");

//获取应答头状态信息

$httpstas = explode(" ",fgets($this->m_fp,256));

$this->m_httphead["http-edition"] = trim($httpstas[0]);

$this->m_httphead["http-state"] = trim($httpstas[1]);

$this->m_httphead["http-describe"] = "";

for($i=2;$i

$this->m_httphead["http-describe"] .= " ".trim($httpstas[$i]);

}

//获取详细应答头

while(!feof($this->m_fp)){

$line = trim(fgets($this->m_fp,256));

if($line == "") break;

$hkey = "";

$hvalue = "";

$v = 0;

for($i=0;$i

if($v==1) $hvalue .= $line[$i];

if($line[$i]==":") $v = 1;

if($v==0) $hkey .= $line[$i];

}

$hkey = trim($hkey);

if($hkey!="") $this->m_httphead[strtolower($hkey)] = trim($hvalue);

}

//判断是否是3xx开头的应答

if(ereg("^3",$this->m_httphead["http-state"]))

{

if($this->JumpCount > 3) return;

if(isset($this->m_httphead["location"])){

$newurl = $this->m_httphead["location"];

if(eregi("^http",$newurl)){

$this->JumpOpenUrl($newurl);

}

else{

$newurl = $this->FillUrl($newurl);

$this->JumpOpenUrl($newurl);

}

}

else

{        $this->m_error = "无法识别的转移应答!"; }

}//

}

//

//获得一个Http头的值

//

function GetHead($headname)

{

$headname = strtolower($headname);

if(isset($this->m_httphead[$headname]))

return $this->m_httphead[$headname];

else

return "";

}

//

//设置Http头的值

//

function SetHead($skey,$svalue)

{

$this->m_puthead[$skey] = $svalue;

}

//

//打开连接

//

function PrivateOpenHost()

{

if($this->m_host=="") return false;

$this->m_fp = @fsockopen($this->m_host, $this->m_port, &$errno, &$errstr,10);

if(!$this->m_fp){

$this->m_error = $errstr;

return false;

}

else{

return true;

}

}

//

//关闭连接

//

function Close(){

@fclose($this->m_fp);

}

//

//补全相对网址

//

function FillUrl($surl)

{

$i = 0;

$dstr = "";

$pstr = "";

$okurl = "";

$pathStep = 0;

$surl = trim($surl);

if($surl=="") return "";

$pos = strpos($surl,"#");

if($pos>0) $surl = substr($surl,0,$pos);

if($surl[0]=="/"){

$okurl = "http://".$this->HomeUrl."/".$surl;

}

else if($surl[0]==".")

{

if(strlen($surl)<=2) return "";

else if($surl[0]=="/")

{

$okurl = "http://".$this->BaseUrlPath."/".substr($surl,2,strlen($surl)-2);

}

else{

$urls = explode("/",$surl);

foreach($urls as $u){

if($u=="..") $pathStep++;

else if($i

else $dstr .= $urls[$i];

$i++;

}

$urls = explode("/",$this->BaseUrlPath);

if(count($urls) <= $pathStep)

return "";

else{

$pstr = "http://";

for($i=0;$i

{ $pstr .= $urls[$i]."/"; }

$okurl = $pstr.$dstr;

}

}

}

else

{

if(strlen($surl)<7)

$okurl = "http://".$this->BaseUrlPath."/".$surl;

else if(strtolower(substr($surl,0,7))=="http://")

$okurl = $surl;

else

$okurl = "http://".$this->BaseUrlPath."/".$surl;

}

$okurl = eregi_replace("^(http://)","",$okurl);

$okurl = eregi_replace("/{1,}","/",$okurl);

return "http://".$okurl;

}

}

?>

相关文章

1a1b05c64693fbf380aa1344a7812747.png

snowflake算法是个啥?首先我来提出个问题,怎么在分布式系统中生成唯一性id并保持该id大致自增?在twitter中这是最重要的业务场景,于是twitter推出了一种snowflake算法。2016-12-12

4f55910a645b073bc4fc65dc10dc14bd.png

这篇文章主要介绍了PHP Echo字符串的连接格式 的相关资料,需要的朋友可以参考下2016-03-03

0ea3c7666119d5615e582f823fb3fad6.png

这篇文章主要介绍了Drupal7连接多个数据库的方法、操作实例,以及常见问题解决方法,需要的朋友可以参考下2014-03-03

4f96a78db829b1556ff16de21e013c7a.png

这篇文章主要介绍了Yii2 ActiveRecord多表关联及多表关联搜索的实现的相关资料,需要的朋友可以参考下2016-06-06

8cc1031babc6aff2319f1c6af8544aa0.png

布尔类型是PHP中 最简单的类型。它的值可以为 TRUE 或 FALSE2013-04-04

0c932a99bb7b6f23c937db507070cc7b.png

这篇文章主要介绍了thinkPHP中配置的读取与C方法,结合实例形式分析了thinkPHP配置文件的功能、位置、分组及读取方法,需要的朋友可以参考下2016-12-12

cca732bf65a93ed2ec0ac80c638460fe.png

这篇文章主要介绍了PHP使用递归按层级查找数据的方法,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下2019-11-11

2d9f31f2af7b675a3d153d2b7f1035a7.png

这篇文章主要给大家介绍了关于如何在Laravel之外使用illuminate组件的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2020-09-09

b452cee8ec5cd9e58ab98eba17281e59.png

这篇文章主要介绍了destoon实现调用当前栏目分类及子分类和三级分类的方法,是destoon开发中非常实用的一个技巧,需要的朋友可以参考下2014-08-08

f4838ec7e2d4da28e0b57d4e852dadd4.png

最近在学习laravel的时候发现了一个有趣的地方,下面和大家分享下,这篇文章主要给大家介绍了关于Laravel路由中不固定数量的参数是如何实现的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面来一起看看吧。2017-12-12

最新评论

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值