php file_get_contents伪造user_agent curl设置

php程序提供的两个函数file_get_contents 和 curl,在抓取远程内容或模拟浏览器访问的时候相当有用。不过一些网站出于安全等考虑会根据来访ip是否携带user_agent信息来判断是正常的浏览器客户端还是机器,如果是机器则拒绝访问。所以,我们的就需要对file_get_contents和curl伪造user_agent。下面给大家详解一下如何file_get_contents伪造user_agent。
 

01 <?php
02 function curl_get_file_contents($URL){
03     $c = curl_init();
04     curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
05     //curl_setopt($c, CURLOPT_HEADER, 1);//输出远程服务器的header信息
06     curl_setopt($c, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.95
07  
08 Safari/537.36 SE 2.X MetaSr 1.0');
09     curl_setopt($c, CURLOPT_URL, $URL);
10     $contents = curl_exec($c);
11     curl_close($c);
12     if ($contents) {return $contents;}
13     else {return FALSE;}
14     }
15 ?>

一、file_get_contents伪造user_agent 方法如下: 

1 ini_set('user_agent','Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.95 Safari/537.36 SE 2.X MetaSr
2  
3 1.0');

二、curl伪造user_agent的方法: 

1 curl_setopt($c, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.95 Safari/537.36
2  
3 SE 2.X MetaSr 1.0');

curl伪造user_agent的完整函数方法

file_get_contents 和 curl 这俩强悍的函数,在远程抓取时候相当有用处.不过一些网站会根据来访ip是否携带user_agent来判断是正常的浏览器客户端还是机器.所以,我们的任务就是给他们伪造user_agent. 
file_get_contents伪造user_agent 方法如下: 
Php代码   收藏代码
  1. ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727;http://www.aerchi.com)');  


curl伪造user_agent的方法: 
Php代码   收藏代码
  1. curl_setopt($c, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727;http://www.aerchi.com)');  


附带上curl的完整函数方法: 
Php代码   收藏代码
  1. function curl_get_file_contents($URL)     
  2.     {     
  3.         $c = curl_init();     
  4.         curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);  
  5. //curl_setopt($c, CURLOPT_HEADER, 1);//输出远程服务器的header信息  
  6. curl_setopt($c, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727;http://www.aerchi.com)');  
  7.         curl_setopt($c, CURLOPT_URL, $URL);     
  8.         $contents = curl_exec($c);     
  9.         curl_close($c);  
  10.         if ($contents) {return $contents;}  
  11.             else {return FALSE;}   
  12.     }  


这样就可以抓取了,并且 user_agent是可以自己修改的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值