今天在抓取数据的时候需要将文件内容的src中的前半部分地址换掉,搞了很久,:
preg_replace('/(<img.+src=\"?.+)(https:\/\/qwety.com\/)(.+\.\"?.+>)/i',"\${1}http://qqqq.cn/\${3}",$content_info);
就可以如实的换掉src中的http地址了。
也有匹配标签的:
$reg1="/<dt><a href=\"\/info\/(.*?).html\">(.*?)<\/a><\/dt>/";
preg_match_all($reg1,$data,$aarray);
分别匹配到 info.1234.html 中的1234(一般为ID)
以及a标签的内容