java 图片 正则表达式_Java 中 利用正则表达式 获取 网页图片

这个Java程序展示了如何抓取指定网页上的图片。通过正则表达式匹配`<img>`标签和`src`属性,获取图片URL,并下载到本地。主要方法包括获取HTML内容、解析图片URL、提取图片源地址以及下载图片。
摘要由CSDN通过智能技术生成

import java.io.File;

import java.io.FileOutputStream;

import java.io.InputStream;

import java.net.URL;

import java.net.URLConnection;

import java.util.ArrayList;

import java.util.List;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

/***

* java抓取网络图片

* @author swinglife

*

*/

public class pimg {

// 地址

private static final String URL = "http://www.csdn.net";

// 编码

private static final String ECODING = "UTF-8";

// 获取img标签正则

private static final String IMGURL_REG = "]*?>";

// 获取src路径的正则

private static final String IMGSRC_REG = "http:\"?(.*?)(\"|>|\\s+)";

public static void main(String[] args) throws Exception {

pimg cm = new pimg();

//获得html文本内容

String HTML = cm.getHTML(URL);

//获取图片标签

List imgUrl = cm.getImageUrl(HTML);

//获取图片src地址

List imgSrc = cm.getImageSrc(imgUrl);

//下载图片

cm.Download(imgSrc);

}

/***

* 获取HTML内容

*

* @param url

* @return

* @throws Exception

*/

private String getHTML(String url) throws Exception {

URL uri = new URL(url);

URLConnection connection = uri.openConnection();

InputStream in = connection.getInputStream();

byte[] buf = new byte[1024];

int length = 0;

StringBuffer sb = new StringBuffer();

while ((length = in.read(buf, 0, buf.length)) > 0) {

sb.append(new String(buf, ECODING));

}

in.close();

return sb.toString();

}

/***

* 获取ImageUrl地址

*

* @param HTML

* @return

*/

private List getImageUrl(String HTML) {

Matcher matcher = Pattern.compile(IMGURL_REG).matcher(HTML);

List listImgUrl = new ArrayList();

while (matcher.find()) {

listImgUrl.add(matcher.group());

}

return listImgUrl;

}

/***

* 获取ImageSrc地址

*

* @param listImageUrl

* @return

*/

private List getImageSrc(List listImageUrl) {

List listImgSrc = new ArrayList();

for (String image : listImageUrl) {

Matcher matcher = Pattern.compile(IMGSRC_REG).matcher(image);

while (matcher.find()) {

listImgSrc.add(matcher.group().substring(0, matcher.group().length() - 1));

}

}

return listImgSrc;

}

/***

* 下载图片

*

* @param listImgSrc

*/

private void Download(List listImgSrc) {

try {

for (String url : listImgSrc) {

String imageName = url.substring(url.lastIndexOf("/") + 1, url.length());

URL uri = new URL(url);

InputStream in = uri.openStream();

FileOutputStream fo = new FileOutputStream("C:/Users/tutu/Desktop/img/"+imageName"//自定义路径);//new File(imageName)相对绝对路径

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值