Android Jsoup:实现HTML解析和Epub解析

jsoup 的基本使用方法:Jsoup中文使用手册

示例1: 练习 jsoup 的基本使用方法

在Eclipse中使用记得带入jsoup-x.xx.x.jar库文件,下载地址:下载 jsoup-x.xx.x.jar库文件

public class MainActivity extends Activity {

private String html = “Jsoup用法

private String url = “http://www.baidu.com”;

@Override

protected void onCreate(Bundle savedInstanceState) {

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_main);

// html文本,url,本地html

Document doc = Jsoup.parse(html);

doc.title();

Elements eles = doc.getElementsByTag(“a”); // a标签

// 遍历Elements的每个Element

for (Element link : eles) {

String linkHref = link.attr(“href”); // a标签的href属性

String text = link.text();

}

// 使用选择器语法来查找元素

Elements elements = doc.select(“a[href]”);

Elements elements2 = doc.select(“img[src$=.png]”);

Element element3 = doc.select(“div.className”).first();

// 数据修改

doc.select(“div.className”).attr(“key”, “value”);

doc.select(“div.className”).addClass(“myclass”); // class=“myclass”

doc.select(“img”).removeAttr(“onclick”);

// 消除不受信任的html (来防止xss攻击)

String htmls = “”; // 不安全的

String safe = Jsoup.clean(htmls, Whitelist.basic()); // 安全的

try {

Document doc2 = Jsoup.connect(url).get();

} catch (IOException e) {

e.printStackTrace();

}

try {

Document doc3 = Jsoup.connect(url).data(“key”, “value”)

.timeout(3000).post();

} catch (IOException e) {

e.printStackTrace();

}

// 若根目录有个index.html文件,否则程序会crash

File input = new File(Environment.getExternalStorageDirectory()

  • “/index.html”);

try {

Document doc4 = Jsoup.parse(input, “utf-8”, “http://baidu.com”);

} catch (IOException e) {

e.printStackTrace();

}

// …/baidu.png -> http://baidu.com/baidu.png

}

}

示例2:使用Jsoup解析HTML新闻列表

新闻地址是:http://mobile.csdn.net/

新闻网页的关键部分截图

《近匠》BeeCloud创始人黄君贤:三行代码集成支付的技术实现

发表于2015-11-03 18:18|4471次阅读|11条评论

《近匠》第106期:成立于2014年的BeeCloud专注于支付云服务,以“让支付更简单”为理念,为开发者及企业提供一站式支付解决方案。其推出的“秒支付Button”无需SDK,三行代码即可一键接入支付功能。

近匠

BeeCloud

Google

黄君贤

支付

SDK

专访贾磊:百度语音实现技术创新,打破汉语语音识别领域壁垒

发表于2015-11-03 14:58|186次阅读|1条评论

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级安卓工程师,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新Android移动开发全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img
img

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频
如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注Android)
img

最后

我这里整理了一份完整的学习思维以及Android开发知识大全PDF,有需要的同学可以自行领取。

资料获取方式:Android完整知识学习体系路线

当然实践出真知,即使有了学习线路也要注重实践,学习过的内容只有结合实操才算是真正的掌握。

我这里整理了一份完整的学习思维以及Android开发知识大全PDF,有需要的同学可以自行领取。

[外链图片转存中…(img-C6pmJkq7-1710759898337)]

资料获取方式:Android完整知识学习体系路线

当然实践出真知,即使有了学习线路也要注重实践,学习过的内容只有结合实操才算是真正的掌握。

  • 20
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java Jsoup是一个用于解析HTML文档的开源库。通过使用Jsoup,您可以轻松地从HTML文档中提取数据或进行数据操作。以下是使用Java Jsoup解析HTML的基本步骤: 1. 下载Jsoup库:您可以从Jsoup的官方网站(https://jsoup.org/)下载Jsoup库的最新版本。 2. 导入Jsoup库:将下载的Jsoup库的JAR文件导入到您的Java项目中。 3. 创建连接:使用Jsoup.connect()方法创建一个Connection对象,将HTML文档的URL作为参数传递给该方法。 4. 获取Document对象:使用Connection对象的get()方法获取一个Document对象,该对象表示整个HTML文档。 5. 使用选择器进行数据提取:使用Jsoup的选择器语法,您可以根据HTML元素的标签、类名、ID等属性来选择和提取数据。 以下是一个基本的Java Jsoup解析HTML的示例代码: ```java import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class HtmlParser { public static void main(String[] args) { try { // 创建连接 Connection connection = Jsoup.connect("http://example.com"); // 获取Document对象 Document document = connection.get(); // 使用选择器提取数据 Elements links = document.select("a[href]"); for (Element link : links) { System.out.println("Link: " + link.attr("href")); System.out.println("Text: " + link.text()); } } catch (IOException e) { e.printStackTrace(); } } } ``` 这个示例代码将从"http://example.com"网页中提取所有链接的URL和文本,并打印出来。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值