php数据采集 之 关于file_get_contents的使用

   file_get_contents  函数的应用

            注意: 开启 php.ini 配置 中 allow_url_fopen =On;

        \

    file_get_contents 中的一些参数:

        

    

       遇到 一些压缩后的网站   比如  :  http://www.sohu.com  ; 打开后  如图 

<?php
header('content-type:text/html; charset=UTF-8');
//使用file_get_contents()
$url="http://www.sohu.com";
$data=file_get_contents($url);  

解决办法

$data=file_get_contents("compress.zlib://".$url);
compress,是一个相当古老的 unix 档案压缩指令,压缩后的档案会加上一个 .Zlib 延伸档名以区别未压缩的档案   zlib是提供数据压缩用的函式库,

获取 采集中的相关类容 ; 


需要使用php正则; 

$url="http://www.sohu.com";
$data=file_get_contents("compress.zlib://".$url);
$preg='#<nav class="nav area">.*</nav>#isU';
preg_match($preg,$data,$result);
$preg2='#<a data-clev=".*" target="_blank" href=".*">.*</a>#isU';
preg_match_all($preg2,$result[0],$result2);
$preg3='#<strong>(.*)</strong>#isU';
foreach($result2[0] as $k=>$v){
  preg_match($preg3,$v,$result3);
 if(!empty($result3)){
        break;
 }
}
print_r($result3);

能得到相应的结果 !!! 

保存图片的话可以用  :file_put_contents('保存地址','图片路径')来存储;

        

    

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值