JAVA 实现简单的网络爬虫,获取网站图片

JAVA 实现简单的网络爬虫,获取网站图片;要抓取网站的图片或是其他的,需要先分析其中的地址格式,然后在确定使用哪种方法去处理。

这个例子抓取的花瓣网上的图片;需要引入jsoup的jar包用于解析网页中元素;jsoup官方下载地址

import java.io.BufferedReader;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.OutputStream;
import java.net.URL;
import java.net.URLConnection;
import java.nio.charset.Charset;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.junit.Test;
/**
 * 爬取图片,并将图片下载到本地
 * @author vf
 */
public class DemoDownLoadPicture {
	String ALL_URL_STR = "";//保存url地址
	String ALL_SRC_STR = "";//保存SRC地址
	int nonameId = 1;
	int record = 0;
	int noPicname = 0;
	/**
	 * 开始,入口
	 * 点击strat方法,右键选择run as->JUnit Test 运行程序
	 * 
	 * 当前获取图片的网站为:http://huaban.com  可更改
	 * 存放图片的地址为 : E://crawler//pic    若无请先创建
	 */
	@Test
	public void start(){
		//要获取的网站地址
		String urlStr = "http://huaban.com";
		String html = getHTML(urlStr);
		getURL(html, 0, "E://crawler//pic");//存放图片的地址;若无请先创建
	}
	
	/**
	 * 获取html网页内容
	 * @param urlStr
	 * @return
	 */
	public 
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值