- 区分同步与异步网站
- jsonpath解析模块
- 同步加载
同步模式,又称阻塞模式,会阻止浏览器的后续处理,停止了后续的解析,因此停止了后续的文件加载(如图像)、渲染、代码执行
- 异步加载
异步加载又称非阻塞,浏览器在下载执行JS的同时,还会继续进行后续网页的处理
因为两种加载数据不一样,因此同步数据一般都会在all里面,类型为document;
而异步加载就不样,它返回的数据一般都在xhr里面,带参数的一些接口更加容易准确定位
3. 网页数据返回的方式:
-----直接返回网页文本
-----ajax加载 ---JSON
-----JavaScript渲染 --- JSON
4. 抓取的网站,大致分为两类
--- 直接返回网页文本 -- HTML
--- 通过接口(数据包)返回数据 ---- JSON
5、同步加载和异步加载的区分
观察刷新按键,
动了 --- 同步
未动 -- 异步