python爬虫,浏览器开发者工具,视频笔记(1)

一,开发者工具
Fn键亮起,按F12键,主要用到前四个:
Elements里都是html代码,王爷都是靠html代码加载出来的。注意,我们在elements里看到的代码是经过脚本执行后的效果,并且是实时的。
强烈建议看本文时打开豆瓣网站,按下F12键
在这里插入图片描述

实时的什么意思?就是可以随时改动的意思。
比如你看到网页上那部分不爽,那你就可以直接在把那一部分的html代码删掉,这样你讨厌的部分就不会显示出来了。

脚本执行之前是页面源代码,页面右键,显示网页源代码就可以查看。
在这里插入图片描述
源代码也是html代码,但是它是脚本运行之前的代码,这里面蕴含这些脚本。
python能拿到的,是脚本里的东西。

源代码没有我们看到的网页上的全部数据,我们能看到的数据是因为源代码里面有一些脚本又重新地发送了请求来拿到数据。

network可以看加载过程,它叫做抓包工具,能看到页面加载过程中加载的所有网络资源

network->XHR->preview,再点左边的资源包,就可以看到加载的数据。

由此可以推断出,浏览器和服务器的工作过程:
浏览器第一次访问豆瓣服务器,返回源代码,是一个网页框架,没数据,然后返回的源代码里的脚本又开始运行,发出第二次请求,这个时候就去访问后面的url地址了,返回数据到已有的刚刚的html框架上,数据和页面框架一结合,就成为我们看到的样子。

network里的Headers可以看到url是什么,这次请求是post请求还是get请求,这次请求是不是成功的,服务器的ip在哪里,还有请求头和响应头。

sourse:能看到当前这个网页在进行加载的时候,总共加载了哪些资源。这里面还可以对代码进行调试。

console:后期gs调试用到

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值