匹配网页HTML元素的正则表达式

$regex1="/.*?<a .*?href=\"(.*?)\" .*? style=\".*?\">.*?/";//匹配<a>的链接地址

$regex2="/.*?<img src=\"(.*?)\" \/>.*?/";//匹配<img>的链接地址

$regex3="/.*?<a.*?target=\"_blank\">\s*(.*?)\s*<\/a>.*?/";//匹配<a>标签包住的内容

$regex4="/.*?<span class=\"content\">(.*?)<\/span>.*?/";//匹配<span>标签包住的内容

 

preg_match("/.*?<p.*?class=\"pageLink\">\s*(.*?)\s*<\/p>.*?/", $htmlcontent, $ptext);

preg_match_all("/.*?<a href=\"(.*?)\">\d/", $ptext[1], $atext);

$pageaddr = $atext[1];mm/

转载于:https://www.cnblogs.com/bigclould/p/9454706.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值