php 采集程序,PHP 简单的采集程序

header('Content-Type: text/html; charset=utf-8');

/**

* 发一个GET请求获取数据

*/

function get($url)

{

global $curl;

// 配置curl中的http协议->可配置的荐可以查PHP手册中的curl_

curl_setopt($curl, CURLOPT_URL, $url);

curl_setopt($curl, CURLOPT_RETURNTRANSFER, TRUE);

curl_setopt($curl, CURLOPT_HEADER, FALSE);

// 执行这个请求

return curl_exec($curl);

}

// 生成一个curl对象

$curl = curl_init();

$url='http://list.youku.com/category/show/c_96_a_%E7%BE%8E%E5%9B%BD_s_1_d_1_p_3.html';

$data=get($url);

// 匹配电影所在位置

$list_preg = '/

.+/Us';

// 匹配img标签上的src和alt

$img_preg = '/(.*)/U';

//匹配电影的url

$video_preg='//U';

//把所有的li存到$list里,$list是个二维数组

preg_match_all($list_preg,$data,$list);

//var_dump($list);

foreach ($list[0] as $k => $v) { //这里$v就是每一个li标签

/* 获取图片及电影名称

preg_match($img_preg,$v,$img); //把匹配到的图片的信息存到$img里

var_dump($img);

*/

/*获取电影地址

preg_match($video_preg,$v,$video); //把匹配到的电影的信息存到$video里

var_dump($video);

*/

preg_match($img_preg,$v,$img);

preg_match($video_preg,$v,$video);

echo $img[0].''.$video[2].'';

}

效果图:

0818b9ca8b590ca3270a3433284dd417.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值