参考:
jsoup selector 选择器语法:https://jsoup.org/cookbook/extracting-data/selector-syntax 。
jsoup 很强大,本来想找到 p 段落标签,后来需要排除某些特例,比如把 table 标签内的 p 给排除掉。不知道怎么写了,查了下官网的文档,试了下是可以的。在这里记录一下,方便大家。
String html = "";
Document doc = Jsoup.parse(html);
Elements paragraphs = doc.select("body:not(table) > p");
找出不在 table 内的 p 标签。