php 抓取

<?php
set_time_limit(0);

$data = array();
$memKey = 'Outnews_nagovnews';

$url = 'http://www.cqna.gov.cn/html/zjna/jrna/';
$contents = file_get_contents($url);
$contents = iconv('gbk', 'utf-8', $contents);
$res = UtilsExt::run()->cutStr($contents, '<div class="sortlist">', '</table></td>');

$tmp = array();
$exp = explode('<li>', $res);
foreach($exp as $k=>$v){
	if($k>0){
		$tmp['time'] = UtilsExt::run()->cutStr($v, '<span>', '</span>');
		$tmp['title'] = UtilsExt::run()->cutStr($v, 'title="', '"');
		$tmp['url'] = 'http://www.cqna.gov.cn'.UtilsExt::run()->cutStr($v, '<a href="', '"');
		
		$con = file_get_contents($tmp['url']);
		$con = iconv('gbk', 'utf-8', $con);
		$tmp['contents'] = UtilsExt::run()->cutStr($con, '<div id="showcontent">', '</div></td>');
		$tmp['contents'] = str_replace('</div><div>', "\r\n", $tmp['contents']);
		$tmp['contents'] = str_replace('<div>', '', $tmp['contents']);
		$tmp['contents'] = strip_tags(str_replace('</div>', '', $tmp['contents']));
		
		$data[] = $tmp;
	}
}

if(class_exists('Memcached')){
	$memcache = new Memcached;
}else{
	$memcache = new Memcache;
}

$memcache->addServer('127.0.0.1', 11211);
$memcache->set($memKey, $data);

if(!class_exists('Memcached')) $memcache->close();
die;

class UtilsExt{
	public static function run($class=__CLASS__){
		return new $class();
	}
	
	public function cutStr($str, $begin, $end){
		$exp1 = explode($begin, $str);
		$exp2 = explode($end, $exp1[1]);
		
		return $exp2[0];
	}
}
?>


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值