这是一个将指定URL地址的网页抓取为本地网页的代码。

最新推荐文章于 2019-09-23 10:40:52 发布

clbxp

最新推荐文章于 2019-09-23 10:40:52 发布

阅读量844

点赞数

分类专栏： JAVA 文章标签： url exception buffer byte null import

JAVA 专栏收录该内容

32 篇文章 0 订阅

订阅专栏

这是一个将指定URL地址的网页抓取为本地网页的代码：

import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.HttpURLConnection;
import java.net.URL;

//CL:得到的是指定URL的HTML文件

 public class GetUrlToHtml {
     public static void main(String[] args) {
         InputStream in = null;   
         OutputStream out = null;              
         try {
             // 检查命令行参数
             if ((args.length != 1)&& (args.length != 2)) 
                 throw new IllegalArgumentException("Wrong number of args");
      
            
             URL url = new URL(args[0]);   //创建 URL
             in = url.openStream();        // 打开到这个URL的流
             if (args.length == 2)         // 创建一个适当的输出流
                 out = new FileOutputStream(args[1]);
             else out = System.out;                       // 复制字节到输出流
             byte[] buffer = new byte[4096];
             int bytes_read;
             while((bytes_read = in.read(buffer)) != -1)
                 out.write(buffer, 0, bytes_read);
 }
       
         catch (Exception e) {
             System.err.println(e);
             System.err.println("Usage: java GetURL <URL> [<filename>]");
         }
         finally { //无论如何都要关闭流
             try { in.close(); out.close(); } catch (Exception e) {}
         }
     }
 }

clbxp

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
这是一个将指定URL地址的网页抓取为本地网页的代码。

这是一个将指定URL地址的网页抓取为本地网页的代码：import java.io.FileOutputStream;import java.io.InputStream;import java.io.OutputStream;import java.net.Http
复制链接

扫一扫