java 爬取网页内容、标题、图片

最新推荐文章于 2024-04-18 23:23:59 发布

zxy199288

最新推荐文章于 2024-04-18 23:23:59 发布

阅读量351

点赞数

分类专栏： java 文章标签： java

本文链接：https://blog.csdn.net/zxy199288/article/details/120491590

版权

package com.fh.util;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**

说明：爬取网页
作者：FH Admin
from：tjhelitong.com
*/
public class GetWeb {

/**
- 获取当前网页的code
- @param httpUrl
- ```
       网页地址
```
- @return
- @throws IOException
  */
  public static String getHtmlCode(String httpUrl) throws IOException {
  String content = “”; // 定义字符串content
  URL url = new URL(httpUrl); // 生成传入的URL的对象
  BufferedReader reader = new BufferedReader(new InputStreamReader(
  url.openStream(), “utf-8”));// 获得当前url的字节流（缓冲）
  String input;
  while

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zxy199288

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java 爬取网页内容、标题、图片

package com.fh.util;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.net.URL;import java.net.URLConnection;import java.util.ArrayList;import java.util.List;import java
复制链接

扫一扫