php a标签里 href的mysql_PHP代码-数据爬取(a标签和a标签所对应的内容)

public function export(){

set_time_limit(1000);

// header("Content-type: text/html; charset=utf-8");

$a = file_get_contents('http://chuangye.yjbys.com/zhengce/');

$reg = '/(.*)

$result = preg_match_all($reg,$a,$match_result);

$arr = array();

foreach($match_result[1] as $k=>$v){

$tnum = strlen($match_result[3][$k]);

if(substr($v,0,1) == 'h' && $tnum>21){

$arr[$k]['art_url'] = $v;

$arr[$k]['art_title'] = mb_convert_encoding($match_result[3][$k], "UTF-8",'gbk');

// $match_result[3][$k];

mb_convert_encoding($match_result[3][$k], "UTF-8",'gbk');

$b = file_get_contents($v);

preg_match('/

";

$cony = str_replace('

',"",$cont);

$cont = str_replace('

',"",$cony);

// $cont = str_replace('“','“',$cont);

// $cont = str_replace('”','”',$cont);

// $cont = str_replace('…','~',$cont);

// $cont = str_replace('—','-',$cont);

// $cont = str_replace('"','“',$cont);

// $cont = str_replace('•','•',$cont);

$arr[$k]['art_content'] = html_entity_decode($cont);

$arr[$k]['state'] = 0;

$arr[$k]['type'] = 4;

$arr[$k]['userid'] = 4;

}

}

$arr = array_values($arr);

// print_r($arr);die;

// $arr2=array_iconv("gbk","utf-8",$arr);

// print_r($arr);die;

$article = M('cxpt_user_article');

var_dump($article->addAll($arr));echo $article->getLastSql();die;

// foreach($arr as &$v){

// $b = file_get_contents($v['url']);

// preg_match('/

(.*)/s',$b,$match);

// $num = strpos($match[0],'');

// $v['content'] = substr($match[0],0,$num);

// }

// foreach($arr as $v){

// $info['art_title'] = $v['title'];

// $info['art_content'] = $v['content'];

// }

// print_r($arr);die;

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值