android jsoup简书,网页爬虫Jsoup使用简介

jsoup 是一款 Java 的HTML 解析器,可通过DOM,CSS选择器以及类似于JQuery的操作方法来提取和操作Html文档数据。

使用效果

5f748f0a90ef

配套视频:

使用步骤

1. 在project的build.gradle添加如下代码(如下图)

allprojects {

repositories {

...

maven { url "https://jitpack.io" }

}

}

5f748f0a90ef

2. 在Module的build.gradle添加依赖

compile 'com.github.open-android:Jsoup:jsoup-1.10.2'

3.演示步骤

a.测试用html内容如下

First parse

attribute parse

text parse

b.将演示代码复制到Activity的onCreate方法中

//测试用html字符串

String html = "

First parse"

+ "

attribute parse

"

+ "

text parse

";

//Jsoup解析获得Document对象

Document doc = Jsoup.parse(html);

System.out.println("解析出来的html:\n"+doc.toString());

//获得head元素对象

Element head = doc.head();

//DOM方式获得第一个title元素

Element title = head.getElementsByTag("title").first();

//获得title元素中文本

String text = title.text();

System.out.println("title标签中文本: " + text);

//---------------------------------------

//获得body元素对象

Element body = doc.body();

//选择器语法查找p元素

Elements lists = body.select("p");

//遍历所有p元素,输出p元素文本

for(Element p : lists){

System.out.println("p元素文本: " + p.text());

}

//选择器语法查找第一个拥有align属性的p元素

Element pElement = body.select("p[align]").first();

//获得p元素align属性值

String align = pElement.attr("align");

System.out.println("p元素align属性值: " + align);

注意:如果解析指定url需要添加网络访问权限

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值