一,开发者工具
Fn键亮起,按F12键,主要用到前四个:
Elements里都是html代码,王爷都是靠html代码加载出来的。注意,我们在elements里看到的代码是经过脚本执行后的效果,并且是实时的。
强烈建议看本文时打开豆瓣网站,按下F12键
实时的什么意思?就是可以随时改动的意思。
比如你看到网页上那部分不爽,那你就可以直接在把那一部分的html代码删掉,这样你讨厌的部分就不会显示出来了。
脚本执行之前是页面源代码,页面右键,显示网页源代码就可以查看。
源代码也是html代码,但是它是脚本运行之前的代码,这里面蕴含这些脚本。
python能拿到的,是脚本里的东西。
源代码没有我们看到的网页上的全部数据,我们能看到的数据是因为源代码里面有一些脚本又重新地发送了请求来拿到数据。
network可以看加载过程,它叫做抓包工具,能看到页面加载过程中加载的所有网络资源
network->XHR->preview,再点左边的资源包,就可以看到加载的数据。
由此可以推断出,浏览器和服务器的工作过程:
浏览器第一次访问豆瓣服务器,返回源代码,是一个网页框架,没数据,然后返回的源代码里的脚本又开始运行,发出第二次请求,这个时候就去访问后面的url地址了,返回数据到已有的刚刚的html框架上,数据和页面框架一结合,就成为我们看到的样子。
network里的Headers可以看到url是什么,这次请求是post请求还是get请求,这次请求是不是成功的,服务器的ip在哪里,还有请求头和响应头。
sourse:能看到当前这个网页在进行加载的时候,总共加载了哪些资源。这里面还可以对代码进行调试。
console:后期gs调试用到