访问动态页面时,会有很多请求,如果用BeautifulSoup只能访问第0个请求,所以爬取大多数网页需要在Network中查找到所需要的请求页面。以QQ音乐的网站为例,在QQ音乐中搜索孙燕姿。
- 找到Network
网页中点击右键,进入检查(ctrl+shift+i),第一行第四个是Network
- Network的功能
记录在当前页面上发生的所有请求。现在点进去看上去好像空空如也的样子,这是因为Network记录的是实时网络请求。现在网页都已经加载完成,所以不会有东西。如果此时点击刷新,浏览器会重新访问网络,Network中就会有记录。
- 红框框里表示共有25个请求,31.0KB流量,黄框框里是具体的25个请求。
(有些网页,直接把所有的关键信息都放在第0个请求里,尤其是一些比较老(或比较轻量)的网站,用reques