php 根据标签的属性值来爬取内容的正则表达式

最近在学着做数据爬虫,经常遇到的一个问题是,经常要根据某个标签的属性值来获取该表下面的内容,

后来找到了一个封装的方法,挺好用的,下面看代码:

/**
	 * $html-需要爬取的页面内容
	 * $tag-要查找的标签
	 * $attr-要查找的属性名
	 * $value-属性名对应的值
	 */
	public function get_tag_data($html,$tag,$attr,$value){
		$regex = "/<$tag.*?$attr=\".*?$value.*?\".*?>(.*?)<\/$tag>/is";
		preg_match_all($regex,$html,$matches,PREG_PATTERN_ORDER);
		return $matches[1];
	}

DONE!!!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值