一般情况下,如果网站请求成功之后,响应的状态码为200;还可以通过getheaders()获取网站请求的信息头部。如果这个方法去掉s,加入参数Server,可以获取服务器名称。下面利用几个实例说明,操作如下:
工具/原料
python
pycharm
截图工具
方法/步骤
1
第一步,在新建的python文件中,导入urllib.request,注意确切的包,如下图所示:
2
第二步,再次调用urllib.request.urlopen(),传入的参数为一个网址,如下图所示:
3
第三步,利用print()方法打印服务请求成功后的状态码,调用status属性,如下图所示:
4
第四步,保存并运行这个python文件,可以看到打印出200结果,如下图所示:
5
第五步,再次获取服务器和网址请求信息头部,打印结果可以发现出现了编码,如下图所示:
6
第六步,再次调用getheaders()方法,传入参数Server,结果发现出现了报错,如下图所示:
END
注意事项
注意如何使用爬虫技术获取网站的状态和信息头
注意导入合适的包获取网站信息
经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。
举报作者声明:本篇经验系本人依照真实经历原创,未经许可,谢绝转载。
展开阅读全部