利用java抓取网页上的所有图片:
用两个正则表达式:
1、匹配html中img标签的正则:]*?>
2、匹配img标签中得src中http路径的正则:http:\"?(.*?)(\"|>|\\s+)
实现:
[java]
view plain
copy
print
?
- package
org.swinglife.main; -
- import
java.io.File; - import
java.io.FileOutputStream; - import
java.io.InputStream; - import
java.net.URL; - import
java.net.URLConnection; - import
java.util.ArrayList; - import
java.util.List; - import
java.util.regex.Matcher; - import
java.util.regex.Pattern; -
-
- public
class CatchImage { -
-
// 地址 -
private static final String "http://www.csdn.net";URL =