已知头部信息的数据项User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36,URL地址:http://www.zhihu.com,请编写相关代码完成该网页的爬取。
要求伪造头部信息,打印返回对象的
状态码及内容,其中对象的编码格式为utf-8。
import requests
url = 'http://www.zhihu.com'
headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}
response = requests.get(url, headers=headers)
response.encoding = 'utf-8'
print(response.status_code)
print(response.text)
结果图: