Java模拟浏览器访问并获取网页代码

本文介绍如何使用Java模拟浏览器访问那些不能直接通过URL获取HTML代码的网站,探讨相关技术和方法。
摘要由CSDN通过智能技术生成

一般的网页可以直接通过URL直接获取HTML的代码

public static void main(String[] args) throws Exception {
    //获取url
    URL url = new URL("https://www.baidu.com");
    //下载资源
    InputStream is = url.openStream();
    BufferedReader br = new BufferedReader(new InputStreamReader(is,"utf-8"));
    String msg = null;
    while (null != (msg = br.readLine())){
        System.out.println(msg);
    }
    br.close();
}

但是有一些网站是不能直接访问的,此时我们需要模拟浏览器再去获取代码

 

public static void main(String[] args) throws Exception {
    //获取url
    URL url = new URL("https://www.dianping.com");
    //下载资源
    HttpURLConnection conn = (HttpURLConnection) url.openConnection();
    conn.setRequestMethod("GET");
    
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以使用Java中的HttpURLConnection类来模拟浏览器访问百度搜索。以下是一个简单的示例代码: ```java import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; import java.net.URLEncoder; public class BaiduSearch { public static void main(String[] args) { try { // 搜索关键词 String keyword = "java"; // 编码关键词 String encodedKeyword = URLEncoder.encode(keyword, "UTF-8"); // 百度搜索地址 String baiduSearchUrl = "https://www.baidu.com/s?wd=" + encodedKeyword; // 创建URL对象 URL url = new URL(baiduSearchUrl); // 创建HttpURLConnection对象 HttpURLConnection connection = (HttpURLConnection) url.openConnection(); // 设置请求方法 connection.setRequestMethod("GET"); // 设置请求头信息,模拟浏览器访问 connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"); // 获取响应状态码 int responseCode = connection.getResponseCode(); if (responseCode == HttpURLConnection.HTTP_OK) { // 获取响应数据 BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream(), "UTF-8")); String inputLine; StringBuilder response = new StringBuilder(); while ((inputLine = in.readLine()) != null) { response.append(inputLine); } in.close(); // 输出响应数据 System.out.println(response.toString()); } else { System.out.println("请求失败,响应状态码为:" + responseCode); } } catch (Exception e) { System.out.println("请求失败,出现异常:" + e.getMessage()); } } } ``` 运行该代码后,控制台会输出百度搜索结果的HTML代码。注意,这里只是一个简单的示例,实际应用中还需要处理一些异常情况,如网络异常、响应状态码非200等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值