Andriod使用Jsoup解析Html

想要做一个看新闻的应用,类似Cnbeta客户端的东西。大致思路如下:根据链接获取新闻列表页的html代码,然后解析,找到所有的新闻标题和新闻链接用listView显示,当点击ListView的Item再加载相应的新闻内容。


其中获取html代码,可以使用如下代码实现:

  1. public String getHtmlString(String urlString) {  
  2.     try {  
  3.         URL url = new URL(urlString);  
  4.         URLConnection ucon = url.openConnection();  
  5.         InputStream instr = ucon.getInputStream();  
  6.         BufferedInputStream bis = new BufferedInputStream(instr);  
  7.         ByteArrayBuffer baf = new ByteArrayBuffer(500);  
  8.         int current = 0;  
  9.         while ((current = bis.read()) != -1) {  
  10.             baf.append((byte) current);  
  11.         }  
  12.         return EncodingUtils.getString(baf.toByteArray(), "gbk");  
  13.     } catch (Exception e) {  
  14.         return "";  
  15.     }  
  16. }  

传入一个网页链接,将返回此链接的html代码(String)。


然后就是解析此html代码了。经过google,发现了java的一个很好用的解析html的库,Jsoup:http://jsoup.org/

很容易使用,方法类似javascript和JQuery。只需先构建一个Jsoup的Document对象,然后就可以像使用js一个解析html了

  1. String htmlString = getHtmlString("http://www.cnbeta.com");  
  2. Document document = Jsoup.parse(htmlString);  
比如要获取cnbeta的html的title,只需:
  1. String title = document.head().getElementsByTag("title").text();  

另外构建Document的时候也可以直接使用URL,像这样:

  1. Document doc = Jsoup.parse(new URL("http://www.cnbeta.com"), 5000);  
其中5000是连接网络的超时时间。


有关Jsoup的下载和更多介绍,见其官网:http://jsoup.org/


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值