使用HttpURLConnection抓网页代码示例

最新推荐文章于 2023-06-07 22:11:30 发布

系统信息

最新推荐文章于 2023-06-07 22:11:30 发布

阅读量1.7k

点赞数

分类专栏： Java体系

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/softwave/article/details/52485455

版权

Java体系专栏收录该内容

380 篇文章 2 订阅

订阅专栏

前几日受人之托，写了一个抓网页代码的小例子，通过一个JSP页面抓取某网站页面的HTML内容。

代码如下：

<%@ page language="java" contentType="text/html; charset=utf-8"
	pageEncoding="utf-8" import="java.util.*,java.io.*,java.net.*"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>抓取页面</title>
</head>
<body>
	<%
		String inputLine = "";
		String urlvalue = "https://www.baidu.com";
		try {
			URL url = new URL(urlvalue);

			URLConnection rulConnection = url.openConnection();
			HttpURLConnection httpUrlConnection = (HttpURLConnection) rulConnection;
			httpUrlConnection.setRequestProperty("User-Agent",
					"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)");
			httpUrlConnection.connect();

			BufferedReader in = new BufferedReader(
					new InputStreamReader(httpUrlConnection.getInputStream(), "UTF-8"));

			inputLine = in.readLine().toString();
		} catch (Exception e) {
			e.printStackTrace();
		}
	%>
<textarea style="height: 500px; width: 500px">
<%
	out.print(inputLine);
%>
</textarea>
</body>
</html>

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

系统信息

CSDN认证博客专家 CSDN认证企业博客

码龄21年

566: 原创

1万+: 周排名

126万+: 总排名

612万+: 访问

: 等级

5万+: 积分

2401: 粉丝

361: 获赞

881: 评论

828: 收藏

私信

关注

热门文章

分类专栏

前台技术 95篇
Java体系 380篇
MS体系 35篇
数据库技术 3篇
软件工程 67篇
代码库 45篇
移动开发 32篇
人生随想 73篇
ERP开发 9篇
百家讲坛 10篇
金融证券 17篇
教学工作 147篇
图形图像 44篇
杂七杂八 220篇
开发随笔 16篇
趣文收藏 18篇
运维技术 1篇

最新评论

解决iText生成pdf文件过大的问题
愈久弥坚: 同问，这个问题解决了吗
计算机程序设计员国家职业标准
想给世界留下 1bite 的印象: 这玩意儿，不是毕业就发吗
解决iText生成pdf文件过大的问题
shiyingzhan: 你的模板文件多大呢，我用的也是这种，我的模板就是5、6M了，
使用redis存储Java对象
Java软件工程师: 基础知识不清楚，请去翻书谢谢，软件开发不是让你这种浮躁的人上博客抄抄代码就学会的。博主就算文章里解答了什么是Jedis，还会有你这样的人问String是什么，为什么要有大括号，为什么每句代码最后要有分号。是不是都得讲讲？你问Jedis是什么，跟问String是什么，没什么区别，我就好奇，你竟然还有勇气喷人，无知与蛮横反而成了你的骄傲吗？你但凡口气好点，评论区一大把人会告诉你Jedis是什么。你但凡别这么浮躁，百度搜一下，你也知道Jedis是什么。你一个伸手党，在这喷别人不是程序员，程序员都跟你一样是个伸手党？你甚至伸手都懒得伸，别人没喂你嘴里是别人的错是吧？
使用redis存储Java对象
Java软件工程师: 基础知识是看书学的，不是让你搜博客的，搜博客就跟翻字典一样，是偶尔哪里用到了翻一下，你身为一个开发者，连入门都没进去，就直接来搜应用，你这种人，才真不能算是一个开发者。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。