在那篇 SEO工作者必须知道的9个网页HTTP状态码 中,对常见的http状态码作了介绍,然而并没有说明如何获取到这些状态码的? 除了使用google chrome F12获取当前网页http状态码和Firefox浏览使用Firebug获取http状态码之外,还有没有别的方法呢?答案是肯定的,接下来将用python3的requests库来轻松获取网页的http响应码。
自开始做SEO工作的那一天起,在初期时候,尽管不少的所谓SEO大牛、以及各种SEO培训班都发出一种言论——SEO不需要懂技术,怀着对这种理论深深的怀疑,一些需求向程序员提交,往往程序员理解不了、各种推辞、各种排期、遭受白眼的情形还历历在目。求人不如求己,自己能做就自己做,做不到的通过学习、也要努力做到。
怀着对技术的渴求,一直在工作之余学习编程语言,从
我不是python的传教士,推荐它的用意,也是为了帮助亲们更好、更有效的完成工作,当然,编程的种种乐趣,你得自己去琢磨,我不会告诉你 ^-^。
言归正传,用requests库来获取网页的各种状态码吧。
新建一个文件: getHttpStatusCode.py 内容如下:
#!/usr/bin/python3
# -*- coding: utf-8 -*-
"""
url: http://www.yangshengliang.com/seo-ji-shu/seo-jiaocheng/722.html
author: fedkey
"""
import requests
import sys
def getHttpStatusCode(url):
us