Java抓取URL指定的HTML内容

最新推荐文章于 2024-06-28 14:26:11 发布

boonyaAlishing

最新推荐文章于 2024-06-28 14:26:11 发布

阅读量372

点赞数

分类专栏： Network 文章标签： java 网络协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/boonyaAlishing/article/details/84431841

版权

Network 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

[color=brown]通过Java获取到URL指定的内容，如果有目标数据可以再写代码解析获取到的内容[/color]


package com.boonya;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.Scanner;

public class WebCapturer {

	/**
	 * 根据用户获取的网络地址获取该网页的内容
	 * @param myURL  地址
	 *    如："http://www.google.com.hk/search?q=biao"
	 * @return
	 */
	@SuppressWarnings("resource")
	public static String getHtmlByURL(String myURL){
		URL url=null;
		String htmlContext="";
		try {
			url = new URL(myURL);
			HttpURLConnection conn;
			try {
				conn = (HttpURLConnection) url.openConnection();
				conn.setRequestProperty("User-Agent", // 很重要
						"Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.9.1.2) "
								+ " Gecko/20090803 Fedora/3.5.2-2.fc11 Firefox/3.5.2");
				conn.setRequestMethod("GET");
				Scanner scanner = new Scanner(conn.getInputStream());
				while (scanner.hasNextLine()) {
					htmlContext+=scanner.nextLine();
				}
			} catch (IOException e) {
				e.printStackTrace();
			}
		} catch (MalformedURLException e) {
			e.printStackTrace();
		}
		return htmlContext;

	}

	public static void main(String[] args) throws Exception {
		System.out.println(WebCapturer.getHtmlByURL("http://www.google.com.hk/search?q=biao"));
	}
}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

boonyaAlishing CSDN认证博客专家 CSDN认证企业博客

码龄14年

143: 原创

-: 周排名

190万+: 总排名

7万+: 访问

: 等级

538: 积分

4: 粉丝

10: 获赞

1: 评论

29: 收藏

私信

关注

热门文章

分类专栏

Tool-Maven 5篇
Netlink 2篇
Tool-Flex 1篇
Java-Basic 25篇
Java-Web 15篇
Web-CSS 3篇
Web-UI 1篇
Web-JavaScript 8篇
DB-mysql 25篇
Java-Mybatis 4篇
DB-sqlserver 3篇
NoSQL 3篇
DB-oracle 18篇
Java-NIO 2篇
DB-H2 6篇
TCPUDP 2篇
Mina 2篇
SEO 2篇
Network 6篇
Tool-Ftp 3篇
DataStructure 1篇
Website-test 1篇
Tool-Excel 1篇
Java-Concurrent 1篇
DB-postgresql 2篇
DB-SQLite 1篇
Eclipse plugins 1篇
DB-NoSQL

最新评论

mysql error 1415:not allowed to return a result set from a function
社会废人: MySQL官方的解释： A.4.14.Can MySQL 8.0 stored routines return result sets? 译：MySQL 8.0存储的例程可以返回结果集吗? Stored procedures can, but stored functions cannot. If you perform an ordinary SELECT inside a stored procedure, the result set is returned directly to the client. You need to use the MySQL 4.1 (or higher) client/server protocol for this to work. 译：存储过程可以，但存储函数不能。如果在存储过程中执行普通的SELECT，结果集将直接返回给客户端。你需要使用MySQL 4.1(或更高)客户端/服务器协议来工作。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。