jsoup属性选择器跟jquery的写法一致。
1.在 QueryParser类中有定义的属性匹配规则 private static final String[] AttributeEvals = new String[]{"=", "!=", "^=", "$=", "*=", "~="}
调用select方法的时候,写法还是有点区别的
select("body > div[class*='top']")
在匹配的时候,"=", "!=", "^=", "$=", "*=", 会忽略[class*='xx']中的单引号或者反斜杠,也就是可以正确匹配
public abstract static class AttributeKeyPair extends Evaluator {
String key;
String value;
public AttributeKeyPair(String key, String value) {
Validate.notEmpty(key);
Validate.notEmpty(value);
this.key = key.trim().toLowerCase();
if (value.startsWith("\"") && value.endsWith("\"")
|| value.startsWith("'") && value.endsWith("'")) {
value = value.substring(1, value.length()-1);
}
this.value = value.trim().toLowerCase();
}
}
只有"~=",不会忽略[class~=‘xx’]中的单引号或者反斜杠。再用它写正则表达式的时候一定要注意不要多写单引号。
public AttributeWithValueMatching(String key, Pattern pattern) {
this.key = key.trim().toLowerCase();
this.pattern = pattern;
}
2.Jsoup中的:lt(),:gt(),:eq(),:nth-child()等通过索引来选取元素,索引值都是它所在同级元素中索引位置,只有nth-child索引从1开始,其他的从0开始
以EQ的源码为示例:
public static final class IndexEquals extends IndexEvaluator {
public IndexEquals(int index) {
super(index);
}
@Override
public boolean matches(Element root, Element element) {
return element.elementSiblingIndex() == index;
}
@Override
public String toString() {
return String.format(":eq(%d)", index);
}
}