剩者为王的一段解析html代码:(项目地址:https://github.com/WuXiaolong/WeWin)
mDocument = Jsoup.parse(doc);
if (isFirst) {
titleData = new ArrayList<String>();
Elements es = mDocument.getElementsByClass("xlistju");
for (Element e : es) {
titleData.add(e.text());
}
}
hrefData = new ArrayList<String>();
Elements es1 = mDocument.getElementsByClass("chromeimg");
for (Element e : es1) {
hrefData.add(e.attr("src"));
}
data = new ArrayList<Map<String, Object>>();
for (int i = 0; i < hrefData.size(); i++) {
map = new HashMap<String, Object>();
if (isFirst) {
map.put("title", titleData.get(i));
}
map.put("imgUrl", hrefData.get(i));
data.add(map);
}
mData.addAll(data);
上面代码中第一行的html(String:doc)的一部分源码如下:
<div class="views-field-phpcode">
<div class="views-field-phpcode"><a href="/ju/59993?juzipic=jdzrma6" title="查看本句" rel="nofollow"><img class="chromeimg" alt="美图美句_小清新图片_jdzrma6" src="http://file.juzimi.com/weibopic/jdzrma6.jpg" width="298px" height="198px" /></a></div><div class="views-field-phpcode-1"><a href="/ju/59993?juzipic=jdzrma6" title="查看本句" class="xlistju" rel="nofollow" >第一,她离开。
<br/>第二,他永别。
<br/>第三,不入局。
<br/>第四,放桓远。</a></div><div class="xqjulistwafo">——<a href="/writer/天衣有风" rel="tag" title="原作者:天衣有风" class="views-field-field-oriwriter-value">天衣有风</a><span class="views-field-field-oriarticle-value">《<a href="/article/凤囚凰" rel="tag" title="出自《凤囚凰》" class="active">凤囚凰</a>》</span></div><div class="views-field-name"><div class="views-field-xqname"><a title="发布人:别期有定 porvinci" href="/u/9751" class="xqusernpop" juuid="9751">别期有定 porvinci</a></div></div><div class="views-field-ops"><a href="/user/login?destination=ju/59993&me=flag" class="flag-action" rel="nofollow" title="喜欢本句">喜欢(37)</a></div><div class="views-field-field-addtoalbum-value"><div class="alllistaddtoalbum"><a href="/user/login?destination=ju/59993&me=addal" class="alllistatalink" title="把这个句子加入你的句集" rel="nofollow">加入句集</a></div></div><div class="views-field-comment-count"><div class="node-nid">59993</div><div class="user-uid">0</div><a href="/comment/reply/59993" class="comment-link">添加评论</a></div><div class="views-field-phpcode-2"><div class='meijusharlabel'>分享到: </div><a class="xqrlistshare_weixin" href="/fenxiangdaoweixin.php?url=ju/59993?juzipic=jdzrma6" title="分享到微信" target="_blank" rel="nofollow">分享到微信</a><div id="bdshare" class="bdshare_t bds_tools get-codes-bdshare" data="{'text':'第一,她离开。 第二,他永别。 第三,不入局。 第四,放桓远。 ——@天衣有风 《凤囚凰》','desc':'第一,她离开。 第二,他永别。 第三,不入局。 第四,放桓远。 ——天衣有风 《凤囚凰》','url':'http://www.juzimi.com/ju/59993','pic':'http://file.juzimi.com/weibopic/jdzrma6.jpg'}"><a class="bds_tsina"></a><a class="bds_tqq"></a><a class="bds_qzone"></a><a class="bds_renren"></a><a class="bds_douban"></a><a class="bds_tieba"></a><a class="bds_fbook"></a><span class="bds_more"></span><a class="shareCount"></a></div></div> </div>
</div>
<div class="views-row views-row-4 views-row-even">
根据名称找到class列表
mDocument.getElementsByClass("xlistju");
e.text()拿出内容
e.attr("src")拿出src属性内容...