php 扒取网页数据

扒取方法

    public function index()
    {
        $url = 'http://www.dytt8.net/';
       // $url = 'Public/txt/movies.txt';
        $content = file_get_contents($url);
        $content = iconv("gb2312", "utf-8//IGNORE",$content);
        $reg = "|<div class=\"co_content2\">(.*?)<\/div>|is";//正则匹配div
        $res = preg_match_all($reg, $content, $match);
        $count = count($match[1]);
        //有数据
        if($count)
        {
            $arr = array();
            $array = array();
            for($i=0;$i<$count;$i++)
            {
                $a = "|<a[^>]*>(.*?)<\/a>|is"; //匹配value
                $patten="/<a href=[\'\"]?([^\'\" ]+).*?>/";//匹配href值
                preg_match_all($a, $match[1][$i], $mat);
                preg_match_all($patten, $match[1][$i], $href);
                foreach($mat[1] as $key=>$val){
                    $array = array(
                         'href'=>'http://www.dytt8.net/'.$href[1][$key],
                         'name'=>$val,
                         'ctime'=>time(),
                    );
                    array_push($arr,$array);
                }

            }
            $res = $this->Movies->addAll($arr);
            if($res)
            {
                echo '抓取成功!';
            }
            else
            {
                echo '抓取失败!';
            }
        }

    }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值