html是一种超文本标记语言。我们平时使用浏览器浏览的web页面几乎都是html格式的文本。下面是一个hello world的html页面的代码:
hello world
从上面的代码我们可以很直观的看出,html和xml语言很像都是树形结构,即一个根节点包含几个子节点,子节点又可以包含自己的子节点…。通常我们把html格式的这种树结构称为:文档树(dom树)
Http请求包含四个部分的内容:
-
请求行(request line)
-
请求头(header)
-
空行
-
参数
抓包的request结构如下:
GET / HTTP/1.1
Host: jwgl.fjnu.edu.cn
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.157 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,/;q=0.8,application/signed-exchange;v=b3
Referer: https://www.baidu.com/link?url=a98CxMug1u-J-RFk4E7kaP9hhk2EK8700MuPKT4cZYTTPG_urDB7Asq8TDNqQJFD&wd=&eqid=f7c332cc007927a4000000065cf20629
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9
Cookie: UM_distinctid=1696fc8ec3e1b0-0585ff9addbe6b-1333062-100200-1696fc8ec3f2f4; ASP.NET_SessionId=1uslg345bvgyqnny4yyjbz45
Connection: keep-alive
请求行:请求行只会有一行,且固定为第一行。在这里是GET / HTTP/1.1
请求头:Host
Upgrade-Insecure-Requests
… Cookie
Connection
这些都是请求头,每一行都是一个请求头 格式为键值对类型。
空行:请求头与参数之间会有一个空行
参数: 因为GET请求的参数是放在URL上的,所以这里的参数没有独占一行
HTTP响应也包含四个部分(这个比较重要):
-
状态行
-
消息报头(有时也俗称响应头)
-
空行
-
响应正文
=========================================================================
Jsoup
类是一个工具类,提供了一些静态函数,主要函数如下:
Jsoup.parse(String html)
该函数的作用是将传入的html格式的字符串解析成文档树,返回值是Document
对象。
Jsoup.parse(File in,String charsetName)
将文件的内容解析成Document
对象。
Jsoup.connect(String url)
根据传入的url返回一个Connection
对象,Connection
类的功能下面会介绍。
Element
类对应文档树中的节点元素,这个类的常用函数如下:
getElementsByClass(String className)
返回所有带有className类属性的孩子节点。
getElementById(String id)
返回对应id的子节点
getElementsByTag(String tagName)
返回标签为tagName的所有孩子节点
jsoup库有着很丰富的功能与API,需要详细了解可以查看官网API文档
=================================================================
在app模块下的build.gradle文件中的dependencies属性里添加一行内容
implementation group: ‘org.jsoup’, name: ‘jsoup’, version: ‘1.8.3’
String html = “” +
“” +
“
“” +
“” +
“hello world” +
“” +
“”;
Document doc = Jsoup.parse(html);//解析html字符串,获取document对象
Elements body = doc.getElementsByTag(“body”);//获取body标签的元素
Element element = body.get(0);//因为body是一个集合类型,所以需要取集合里的第一个元素
System.out.println(element.text());//打印元素的内容 hello world
String title = doc.title();//获取title值
System.out.println(title);
运行结果:
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数初中级Android工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则近万的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Android移动开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Android开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
如果你觉得这些内容对你有帮助,可以扫码获取!!(备注:Android)
小结
有了这么多优秀的开发工具,可以做出更高质量的Android应用。
当然了,“打铁还需自身硬”,想要写出优秀的代码,最重要的一点还是自身的技术水平,不然用再好的工具也不能发挥出它的全部实力。
在这里我也分享一份大佬自己收录整理的Android学习PDF+架构视频+面试文档+源码笔记,还有高级架构技术进阶脑图、Android开发面试专题资料,高级进阶架构资料这些都是我闲暇还会反复翻阅的精品资料。在脑图中,每个知识点专题都配有相对应的实战项目,可以有效的帮助大家掌握知识点。
总之也是在这里帮助大家学习提升进阶,也节省大家在网上搜索资料的时间来学习,也可以分享给身边好友一起学习
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!
ndroid开发面试专题资料,高级进阶架构资料**这些都是我闲暇还会反复翻阅的精品资料。在脑图中,每个知识点专题都配有相对应的实战项目,可以有效的帮助大家掌握知识点。
总之也是在这里帮助大家学习提升进阶,也节省大家在网上搜索资料的时间来学习,也可以分享给身边好友一起学习
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!