file_get_contents被屏蔽解决方法

许多作为虚拟主机出租的服务器,一般都会把file_get_contents、fsockopen等一些IO操作的函数禁用掉,因为它们怕被 DDOS。
但是许多站长有需要用到这种函数来抓取URL页面内容,比如说我需要抓取各大网站UED博客里的RSS内容,输出到我的首页。
那么一般情况下,我们改不了服务器的 inc.php,只能自己写一套IO来代替上面的PHP函数了。
$url = file_get_contents('http://www.chongqingwangzhai.com/');
我们可以用下面的代码代替
//禁用file_get_contents的解决办法
$ch = curl_init();
$timeout = 10; // set to zero for no timeout
curl_setopt ($ch, CURLOPT_URL,'http://www.chongqingwangzhai.com/');
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$url = curl_exec($ch);
curl是一个利用URL语法规定来传输文件和数据的工具,支持很多协议,如HTTP、FTP、TELNET等,它不会被服务器禁用,所以我们可以用来模拟file_get_contents一样打开一条URL。
而一般我们要抓取页面数据,例如新浪微博、百度论坛等得页面,都需要登录状态下才能进入列表页面,所以这个时候就需要用curl模拟登录,再打开URL,原理就是利用curl设置http访问的头部信息,模拟登录的头部信息,让对方服务器认为你是在登录状态。具体实现方法就不说了,网上很多。
希望这个解决方法可以帮到某些站长。
阅读更多

没有更多推荐了,返回首页