正则表达式应用笔记----解析网页，获取并显示“未来三天全国天气预报”（java）

最新推荐文章于 2022-03-13 17:21:21 发布

NearEast

最新推荐文章于 2022-03-13 17:21:21 发布

阅读量1.6k

点赞数

分类专栏： Java web 文章标签：正则表达式 java 正则表达式工具 string

本文链接：https://blog.csdn.net/NearEast/article/details/7382206

版权

web 同时被 2 个专栏收录

30 篇文章 0 订阅

订阅专栏

Java

16 篇文章 0 订阅

订阅专栏

用Java语言，读取网页内容，并利用正则表达式工具解析其中包含的天气信息。原网址为http://www.weather.com.cn/index/zxqxgg/wlstyb.shtml，查看源代码找出天气信息的位置，然后就可以动手了。

为演示方便，单独写了一个jsp页面来测试；注意编码等细节问题。

<%@ page language="java" contentType="text/html; charset=utf-8"
    pageEncoding="utf-8"%>
<%@ page import="java.net.URL" %>
<%@ page import="java.util.regex.Matcher" %>
<%@ page import="java.util.regex.Pattern" %>
<%@ page import="java.io.IOException" %>
<%@ page import="java.io.BufferedReader" %>
<%@ page import="java.io.InputStreamReader" %>

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>未来三天全国天气预报</title>
</head>
<body>

<%
	String weather = null;
	try {
		URL a = new URL("http://www.weather.com.cn/index/zxqxgg/wlstyb.shtml");
		BufferedReader br = new BufferedReader(new InputStreamReader(a.openStream(),"utf-8"));
		String li = null;
		Pattern p = Pattern.compile("<DL id=mainContent>.*?</DL>");
		Matcher m = null;
		while ((li = br.readLine()) != null) {
			m = p.matcher(li);
			if (m.find()) {
				weather = new String(m.group().getBytes());
				weather = weather.replaceAll("<a.*?<br\\s*/>", "");
				break;
			}
		}
		br.close();
	} catch (IOException e) {
		e.printStackTrace();
	}

	out.println( weather );
%>

</body>
</html>