java读取网页信息

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class ReadWebPage {
 public static void main(String[] args) {
  try {
   URL url = new URL("http://www.3158.com/view/dome/lxwm.shtml");
   HttpURLConnection connection = (HttpURLConnection) url.openConnection();
   InputStream is = connection.getInputStream();
   BufferedReader br = new BufferedReader(new InputStreamReader(is));
   String line = "";
   while ((line = br.readLine()) != null) {
    parse(line);
   }
  } catch (FileNotFoundException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  } catch (IOException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }
 }

 private static void parse(String line) {
  // 获取邮箱
  Pattern p = Pattern.compile("[//w[.-]]+@[//w[.-]]+//.[//w]+");
  // 获取手机号码
  // Pattern p = Pattern.compile("1[3,5]//d{9}");
  Matcher m = p.matcher(line);
  while (m.find()) {
   System.out.println(m.group());
  }
 }
}

Java中,获取网页错误信息通常涉及到网络请求库,比如Apache HttpClient、OkHttp或者更现代的Java HttpURLConnection。当你尝试从互联网上获取数据时,可能会遇到各种HTTP状态码,这些状态码表示了请求的结果。例如: 1. **404 Not Found** - 页面未找到,意味着服务器找不到请求的资源。 2. **500 Internal Server Error** - 服务器内部错误,可能是服务端的问题。 获取这些错误信息的基本步骤如下: ```java import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; public class WebRequestExample { public static void main(String[] args) throws Exception { String url = "http://example.com"; // 替换为你需要访问的网址 try (HttpURLConnection connection = (HttpURLConnection) new URL(url).openConnection()) { int responseCode = connection.getResponseCode(); if (responseCode >= 400) { // 大多数错误代码范围在此 BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getErrorStream())); String errorLine; System.out.println("Error code: " + responseCode); while ((errorLine = reader.readLine()) != null) { System.out.println("Error message: " + errorLine); } reader.close(); } else { System.out.println("Success! Status code: " + responseCode); } } } } ``` 在这个例子中,如果响应码不是200(成功),程序会读取并打印错误消息流。记得处理异常,因为网络连接可能会失败。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值