可以使用 Java 的网络编程库(如 java.net 包中的 URL 类)来爬取网页数据。首先,你需要打开一个 URL 连接,然后使用类似于输入流的方式来读取网页的 HTML 源代码。
例如,你可以使用以下代码来爬取一个网页的 HTML 源代码:
URL url =new URL("http://www.example.com");
InputStream inputStream = url.openStream();
BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));