#概述
jsoup是JAVA HTML 解析器
可以解析HTML
这样就不用自己写正则表达式了 再说我也不是很会写
下载
导入的方法我也写过了
#用法
##Document
首先先要新建个这个对象
String url = "https://jsoup.org";
Document document = Jsoup.connect(url).get();
System.out.println(document);
这样就把url的全部html给打印出来了
比用httpClient方便很多,不过那个还是有个最强的维护session的功能,不知道这个由没有
当然了 也可以这么用
Document document = Jsoup.parse(html);
其中html就是html字符串
##.text()
System.out.println(document.text());
这么写 就可把文本解析出来
##element
HTML就是由一个一个element (元素)构成了
以前称tag(标签)
Element element = document.getElementById();
Elements elements = document.getElementsByClass();
一堆方法可以把需要的选出来 不再赘述
element.attr();
element.text();
这样选
还支持css选择器
element.select()
不再赘述
总之很好用 暂时不需要学正则表达式了