在本文中,我想描述如何在Android中使用JSoup 。 JSoup是一个Java库,可帮助我们提取和处理HTML文件。 在某些情况下,我们想从HTML页面解析和提取一些信息,而不是渲染它们。 在这种情况下,我们可以使用JSoup ,它具有一组易于使用并集成到我们的Android项目中的强大API。 在本文中,我们将讨论如何设置和使用JSoup的Android项目以及如何提取一些信息。
JSoup简介
如前所述,JSoup是一个Java库,提供了一组API来提取和处理HTML文件。 有几种读取和解析HTML页面的方法。 在本例中,我们要从远程服务器检索它,然后必须提供一个URL。 如果我们想将页面解析为DOM,我们有:
Document doc = Jsoup.connect(URL).get();
其中doc是包含检索到的文档的Document类的实例。 现在我们有了我们的文档,我们可以自由提取信息。 我们可以使用HTML标签检索标题或其他信息。
例如,如果我们要获取所有名为meta
的标签,我们可以:
Elements metaElems = doc.select("meta");
select是我们要使用CSS查询获取标签时要使用的方法。 例如,如果我们想从标签中检索属性值,我们可以:
String name = metaElem.attr("name");
name
是属性名称。 此外,我们可以选择HTML页面中具有特定CSS类值的所有元素。