引言-你看不懂的原因😎:
不知大家是否有过这种感觉:自己找的基础教程一看就懂,以为自己啥都会了😎,想看一下大牛教程,结果呢?人家都说"人生苦短,我用python"😎,结果你倒好,直接看的怀疑人生😱,不知所云,为啥会这样呢😬?基础不会😂?会呀😎!玩的不熟😶?熟呀😎,一提爬虫能的不得了😎,还一套一套的😎!那为啥呢?因为人家都那种水平了,肯定学爬虫不会只学爬虫,前端人家也玩的六,到但你不一样呀,你是小白呀😵,为了让大家了却这桩心事😇,我就写了这篇文章让你哭的舒服点😎
目录:
- 元素
- 各种节点
- DOM
- 总结
1,元素
这个概念相信搞爬虫的都听过吧,😎如果没有😱,自己好好看看基础教程,我也无力回天了,反正它就是所有标签的统称
2,各种节点
节点其实和DOM非常相似,不懂它的苦处小编是深有体会,特别是在看xpath专业的教程和BeautifulSouo官方文档的时候那种感觉尤为名显😱,所以这里就介绍的详细一点
HTML中所有内容文我们将其称之为节点,因为HTML文件中有元素 标签 属性,所以节点中也有元素节点 标签节点 属性节点,接着让我们捋一捋几点之间的关系,为了方便表述,我们就先写一个源码:
<html>
<head>
<title>我最帅</title>
</head>
<baby>
<a href:"https://abc.def.ghi">我难道不帅吗</a>#瞎编的,没用
<h1>看我这吗么帅,还不赶紧点赞收藏起来</h1>
</baby>
</html>
父节点:比如这里,<head>标签就是就是<title>标签的父节点,<html>标签就是<head>节点的父节点
根节点:最顶级的节点我们称之为根,在HTML文件中,根节点就是<html>标签(不止这个文件是,所有文件都是),根节点也是唯一没有父节点的标签
兄弟节点:同级标签,比如这里的<baby>标签和<head>标签
子标签:和父节点刚好相反,下级标签,比如<head>和<html>
2,.DOM对象树
它是DocumentObjectModel(文档对象树)的简称,是表示和处理HTML与XML文件的一种方法(注意这里是方法),当HTML文件在浏览器加载时,浏览器就会将文件解析成DOM,在这里我们首先可以明确一点,DOM是树形结构的,下面我们就来刨析一下这个树型结构:
(1)树根:因为我们要解析的对象是HTML文档
(2)树干:文档的根节点,在HTML中对应的就是<html>和</html>
(3)分出的枝丫:<head>,<baby>
(4)树枝树叶:两个枝丫上所附带的标签,比如这里的<h1>,<a>
4,总结
其实节点和DOM确实很像,但也是有区的,DOM是将源码解析成一种树形结构然后表示出来的一种方法,字节则是HTML文件的所有内容,是一个实体,所以他们的区别就是一个是实体😇,另一个是方法
本文如有不对的地方或需要补充的部分,欢迎各位读者前来补充😃