如果使用代码
Elements trAreas = t1Area.select("tr[bgcolor=\"#c5d5c5\"]").select("a[href]");
获取出的elements类似以下样子:
<a style="COLOR: #0000ff" href="********************************">第一个链接</a>
################################################################################
<a style="COLOR: #0000ff" href="********************************">第二个链接</a>
################################################################################
<a style="COLOR: #0000ff" href="********************************">第三个链接</a>
################################################################################
<a href="********************************">第四个链接</a>
################################################################################
<a href="********************************">第五个链接</a>
可以看到前三个a标签是附带有style属性的,后两个无style属性。
那这个时候可以在elements中这样调用:
trAreas = t1Area.select("tr[bgcolor=\"#c5d5c5\"]").select("a[href]");.not("a[style]")
即可过滤成
################################################################################
<a href="********************************">第四个链接</a>
################################################################################
<a href="********************************">第五个链接</a>