使用此正则可以采集网页中的img标签中的src部分。此PHP正则表达式算是我找到比较完美的正则匹配了。
它可以很好的避免样式的影响,如<img class="b12" src…………/>也能采到src部分。
不多说了上PHP正则:
1 | <?php |
2 | $html = file_get_contents ( 'http://www.qq.com' ); |
3 | $search = '|<img[^>]+src="([^"]*)"[^>]+>|si' ; |
4 | preg_match_all( $search , $html , $images ); |
5 |
6 | printf( "<p>输出images数据为:</p><pre>%s</pre>\n" ,var_export( $images ,TRUE)); |
7 | ?> |
输出的信息是数组
0=》是<img> 标签的整个语句。
1=》是<img> 标签SRC部分。
很用有是吧
你也可以过滤掉非src的属性,看此文:http://enenba.com/?post=164
附件下载/演示源码:
【 get_img.htm 】 5.97KB
转载:http://enenba.com/?post=44