Python网络爬虫案例实战:静态网页爬取:获取响应内容
3.2获取响应内容
在Python爬虫网络中,可以使用r.encoding获取网页编码。
>>> import requests
>>> r=requests.get('http://www.zhidaow.com')
>>> r.encoding
'utf-8'
在Python 中,当发送请求时,Requests 会根据HTTP头部来猜测网页编码,当使用r.text时,Requests就会使用这个编码。当然你还可以修改 Requests的编码形式。例如:
>>> import requests
>>> r=requests.get('http://www.zhidaow.com')
>>> r.encoding
'utf-8'
>>>r.encoding = 'IS0-8859-1'