爬虫学习之Java（一）

唐君超

于 2017-06-14 15:17:23 发布

阅读量338

点赞数

分类专栏：爬虫

本文链接：https://blog.csdn.net/Ivan_Tani/article/details/73234696

版权

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

爬虫学习（一）

抓取网页源码

代码块：

package com.spider;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;

public class BaiduSourceCodeTest {

    public static void main(String[] args) {

        String url = "http://www.baidu.com";

        String result = "";

        BufferedReader in = null;

        try {
            URL realUrl = new URL(url);

            URLConnection con = realUrl.openConnection();

            con.connect();

            in = new BufferedReader(new InputStreamReader(con.getInputStream()));

            String line;

            while((line=in.readLine()) != null) {
                result = result + line;
            }

        } catch (MalformedURLException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } finally {
            if(in != null) {
                try {
                    in.close();
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
        }

        System.out.println(result);

    }

}

唐君超

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬虫学习之Java（一）

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
复制链接

扫一扫