java代码实现网页源码爬取
java代码基于Eclipse简单实现网页源码爬取
哈哈,大家好!我是yanxiaolxy,前天四级英语考试考完了,作业也不多了,感觉整个人都变得轻松了许多。
今天给大家分享我的最新java学习进程--java网页源码爬虫,废话不多说盘代码。
仅需一页代码:
package 网站爬虫2;
/**
* 爬取目标网页源代码示例
* @作者 YanXiaolxy
* @版本 2020.03
* @时间 2020年12月14日 下午1:14:14
*/
import java.io.BufferedWriter;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileWriter;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
public class webHtmlCrawer {
public static void main(String[] args) {
newFile();
}
public static String getConnection() {
String path = "https://www.taobao.com/";
try