今天爬知乎的时候把整个html写进本地文件,拟先用浏览器打开,观察爬虫请求到的网页大致什么样子,再做解析页面的策略
但浏览器打开.html文件后页面一直跳转,如下
解决方案:
用文本编辑器打开html文件,按Ctrl+H,将全文的js替换成空格或者其他即可
再打开就正常了
今天爬知乎的时候把整个html写进本地文件,拟先用浏览器打开,观察爬虫请求到的网页大致什么样子,再做解析页面的策略
但浏览器打开.html文件后页面一直跳转,如下
解决方案:
用文本编辑器打开html文件,按Ctrl+H,将全文的js替换成空格或者其他即可
再打开就正常了