php抓取网页特定div区块及图片,从简单入手

1. 取得指定网页內的所有图片:
<?php
//取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');
 
//取得第一個img标签,並储存至阵列match(regex语法与上述同义)
preg_match('/<img[^>]*>/Ui', $text, $match);
 
//打印match
print_r($match);
 
 
-----------------
2. 取得指定网页內的第一张图片:
<?php
//取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');
 
//取得第一個img标签,並储存至阵列match(regex语法与上述同义)
preg_match('/<img[^>]*>/Ui', $text, $match);
 
//打印match
print_r($match);
 
 
------------------------------------
 
 
3. 取得指定网页內的特定div区块(藉由id判断):
<?php
//取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');
 
//去除換行及空白字元(序列化內容才需使用)
$text=str_replace(array("\r","\n","\t","\s"), '', $text); 
 
//取出div标签且id為PostContent的內容,並储存至阵列match
preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <\/div>/si',$text,$match);
 
//打印match[0]
print($match[0]);
 
 
-------------------------------------------
4. 上述2及3的结合:
<?php
//取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/'); 
 
//取出div标签且id為PostContent的內容,並储存至阵列match
preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <\/div>/si',$text,$match); 
 
//取得第一個img标签,並储存至阵列match2
preg_match('/<img[^>]*>/Ui', $match[0], $match2);
 
//打印match2[0]
print_r($match2[0]);
 
转载请声明来源!
 

转载于:https://www.cnblogs.com/ppeenngg/p/7198371.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值