Java 网页 读取 解析 java天气预报

这篇博客介绍了如何利用Java实现对网页的解析,特别是针对非标准HTML的处理。作者因为要抓取中国天气预报网的内容,创建了一个htmlparser包。这个包允许通过标签路径快速获取所需内容,如天气、日期、温度等。文章提供了示例代码,展示如何使用htmlparser获取天气相关数据。
摘要由CSDN通过智能技术生成

1.解析页面 http://www.baidu.com/more/ 


a.获取所有服务名称:

package com.siqi.samples;

import com.siqi.htmlparser.HtmlParser;
import com.siqi.htmlparser.Tag;
import com.siqi.htmlparser.WebUtils;

public class TestWebPage {
  public static void main(String... args) {
    
    
    try {
      //获取网页
      WebUtils webUtil = new WebUtils();
      webUtil.processUrl("http://www.baidu.com/more/");
      //解析网页
      HtmlParser parser = new HtmlParser(webUtil.getWebContent(),webUtil.getCharset());
      parser.parse();

      //打印网页标签路径为"html/body/div/div/div/div/h3"的内容
      String values = "";
      for(String str : parser.getTagValues("html/body/div/div/div/div/h3")) {
        values = values + str + " ";
      }
      System.out.println(values);
      
    } catch (Exception e) {
      e.printStackTrace();
    }
    
  }
}
结果:

新上线新! 搜索服务 导航服务 社区服务 游戏娱乐 移动服务 站长与开发者服务 软件工具 其他服务 


b.获取所有产品名称:

代码:

package com.siqi.samples;

import com.siqi.htmlparser.HtmlParser;
import com.siqi.htmlparser.Tag;
import com.siqi.htmlparser.WebUtils;

public class TestWebPage {
  public static void main(String... args) {
    
    
    try {
      //获取网页
      WebUtils webUtil = new WebUtils();
      webUtil.processUrl("http://www.baidu.com/more/");
      //解析网页
      HtmlParser parser = new HtmlParser(webUtil.getWebContent(),webUtil.getCharset());
      parser.parse();

      //打印网页标签路径为"html/body/div/div/div/div/div/div/a"的内容
      String values = "";
      for(String str : parser.getTagValues("html/body/div/div/div/div/div/div/a")) {
        values = values + str + " ";
      }
      System.out.println(values);
      
    } catch (Exception e) {
      e.printStackTrace();
    }
    
  }
}

结果:

 百度认证  百度壁纸  百度桌面  百度魔图  百度一键Root  网页  视频  音乐  地图  新闻  图片  词典  常用搜索  hao123  网站导航  百度团购  文库  空间  百科  贴吧  知道  搜藏  经验  百度阅读  百度身边  百度旅游  百度新知  百度相册  百度校园  百度游戏  百度应用  悠洋游戏  移动搜索  掌上百度  手机输入法  百度搜索  百度手机浏览器  百度移动应用  百度手机地图  百度云智能终端平台  百度通讯录  百度网盘  搜索开放平台  站长平
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值