看不懂爬虫教程?看看是不是不知道这几个前端概念(前端0基础也能看懂)

引言-你看不懂的原因😎:

不知大家是否有过这种感觉:自己找的基础教程一看就懂,以为自己啥都会了😎,想看一下大牛教程,结果呢?人家都说"人生苦短,我用python"😎,结果你倒好,直接看的怀疑人生😱,不知所云,为啥会这样呢😬?基础不会😂?会呀😎!玩的不熟😶?熟呀😎,一提爬虫能的不得了😎,还一套一套的😎!那为啥呢?因为人家都那种水平了,肯定学爬虫不会只学爬虫,前端人家也玩的六,到但你不一样呀,你是小白呀😵,为了让大家了却这桩心事😇,我就写了这篇文章让你哭的舒服点😎


目录:

  1. 元素
  2. 各种节点
  3. DOM
  4. 总结

1,元素

这个概念相信搞爬虫的都听过吧,😎如果没有😱,自己好好看看基础教程,我也无力回天了,反正它就是所有标签的统称

2,各种节点

节点其实和DOM非常相似,不懂它的苦处小编是深有体会,特别是在看xpath专业的教程和BeautifulSouo官方文档的时候那种感觉尤为名显😱,所以这里就介绍的详细一点

HTML中所有内容文我们将其称之为节点,因为HTML文件中有元素 标签 属性,所以节点中也有元素节点 标签节点 属性节点,接着让我们捋一捋几点之间的关系,为了方便表述,我们就先写一个源码:

<html>

     <head>

         <title>我最帅</title>

     </head>

    <baby>

      <a href:"https://abc.def.ghi">我难道不帅吗</a>#瞎编的,没用

     <h1>看我这吗么帅,还不赶紧点赞收藏起来</h1>

   </baby>

</html>

父节点:比如这里,<head>标签就是就是<title>标签的父节点,<html>标签就是<head>节点的父节点

根节点:最顶级的节点我们称之为根,在HTML文件中,根节点就是<html>标签(不止这个文件是,所有文件都是),根节点也是唯一没有父节点的标签

兄弟节点:同级标签,比如这里的<baby>标签和<head>标签

子标签:和父节点刚好相反,下级标签,比如<head>和<html>

2,.DOM对象树

它是DocumentObjectModel(文档对象树)的简称,是表示和处理HTML与XML文件的一种方法(注意这里是方法),当HTML文件在浏览器加载时,浏览器就会将文件解析成DOM,在这里我们首先可以明确一点,DOM是树形结构的,下面我们就来刨析一下这个树型结构:

(1)树根:因为我们要解析的对象是HTML文档

(2)树干:文档的根节点,在HTML中对应的就是<html>和</html>

(3)分出的枝丫:<head>,<baby>

(4)树枝树叶:两个枝丫上所附带的标签,比如这里的<h1>,<a>

4,总结

其实节点和DOM确实很像,但也是有区的,DOM是将源码解析成一种树形结构然后表示出来的一种方法,字节则是HTML文件的所有内容,是一个实体,所以他们的区别就是一个是实体😇,另一个是方法

本文如有不对的地方或需要补充的部分,欢迎各位读者前来补充😃

 

 

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值