想要做一个看新闻的应用,类似Cnbeta客户端的东西。大致思路如下:根据链接获取新闻列表页的html代码,然后解析,找到所有的新闻标题和新闻链接用listView显示,当点击ListView的Item再加载相应的新闻内容。
其中获取html代码,可以使用如下代码实现:
- public String getHtmlString(String urlString) {
- try {
- URL url = new URL(urlString);
- URLConnection ucon = url.openConnection();
- InputStream instr = ucon.getInputStream();
- BufferedInputStream bis = new BufferedInputStream(instr);
- ByteArrayBuffer baf = new ByteArrayBuffer(500);
- int current = 0;
- while ((current = bis.read()) != -1) {
- baf.append((byte) current);
- }
- return EncodingUtils.getString(baf.toByteArray(), "gbk");
- } catch (Exception e) {
- return "";
- }
- }
传入一个网页链接,将返回此链接的html代码(String)。
然后就是解析此html代码了。经过google,发现了java的一个很好用的解析html的库,Jsoup:http://jsoup.org/
很容易使用,方法类似javascript和JQuery。只需先构建一个Jsoup的Document对象,然后就可以像使用js一个解析html了
- String htmlString = getHtmlString("http://www.cnbeta.com");
- Document document = Jsoup.parse(htmlString);
- String title = document.head().getElementsByTag("title").text();
另外构建Document的时候也可以直接使用URL,像这样:
- Document doc = Jsoup.parse(new URL("http://www.cnbeta.com"), 5000);
有关Jsoup的下载和更多介绍,见其官网:http://jsoup.org/