php正则表达式获取div,PHP使用表正则表达式获取HTML内容

php怎么抓取网页某个DIV区块的内容。像funp推推王那样每次推文都会显示文章内的图片,提供缩图撰择,又是怎么做到的?其实这语法出乎意料的简短…

1. 取得指定网页内的所有图片:测试

开新视窗复制代码列印?

//取得指定位址的内容,并储存至text

$text=file_get_contents('http://www.tra56/');

//取得所有img标识,并储存至二维阵列match

preg_match_all('#]*>#i', $text, $match);

//输出match

print_r($match);

?>

2. 取得指定网页内的第一张图片:测试

开新视窗复制代码列印?

//取得指定位址的内容,并储存至text

$text=file_get_contents('http://www.tra56/');

//取得第一个img,并储存至阵列match(regex语法与上述同义)

preg_match('/]*>/Ui', $text, $match);

//输出match

print_r($match);

?>

3. 取得指定网页内的特定div区块:测试

//取得指定位址的内容,并储存至text

$text=file_get_contents('http://www.tra56/2018/01/');

//去除换行及空白字元(序列化内容才需使用)

//$text=str_replace(array("r","n","t","s"), '', $text);

//取出div且id为PostContent的内容,并储存至阵列match

preg_match('/

]*id="PostContent"[^>]*>(.*?) 
/si',$text,$match);

//输出match[0]

print($match[0]);

?>

4. 上述2及3的结合:测试

//取得指定位址的内容,并储存至text

$text=file_get_contents('http://www.tra56/2018/01/');

//取出div标籤且id为PostContent的内容,并储存至阵列match

preg_match('/

]*id="PostContent"[^>]*>(.*?) 
/si',$text,$match);

//取得第一个img,并储存至阵列match2

    preg_match('/]*>/Ui', $match[0], $match2);

//输出match2[0]

print_r($match2[0]);

?>

方式可以用,只是个人觉得file_get_contents效率不高,建议改成curl

顶一下

(0)

100%订阅

回复

踩一下

(0)

100%

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值