1.jsoup介绍
很多时候,我们需要从各种网页上面抓取数据,而jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
jsoup官方文档:
https://jsoup.org/cookbook/
中文文档:
http://www.open-open.com/jsoup/
接下来开始手把手教学
-
首先,也是很重要的一步,就是下载jar包,丢到libs里面
jar包下载地址:
http://jsoup.org/download -
Android studio玩家可以不下载jar包,在Gradle里面加入
dependencies { compile 'org.jsoup:jsoup:1.9.2' }
替换img标签的src案例:
String text = patientCaseData.getContent();//网页获取的html文本
Document mDocument = Jsoup.parse(text);
Elements imageSrc = mDocument.select("img[src]");
for (Element element : imageSrc) {
String imgUrl = IpConfig.getCWSDomainName() + element.attr("src");
element.attr("src", imgUrl);
}
text = mDocument.toString();