#使用requests模块发送请求获取代码
import requests
#发送请求,获取响应
response = requests.get('http://www.baidu.com')
#获取响应数据
print(response.text) # 会打印出类似乱码的字符串,其实是西欧的字体
#获取编码用的字符集
print(response.encoding) # 会打印出ISO-8859-1, 是西欧字符集,官方说是根据响应头推断出要用的编解码字符集,但很明显不对的,编码和解码要用一致的字符集才行
#解决方法有两个
#方法一,可以通过设置字符编码response.encoding 来匹配指定的解码,这样就不会乱码了。
response.encoding = 'utf8' #utf8字符集目前大部分用它
print(response.text) # 就会打印出正常的字符串了
#方法二: 获取reponse的二进制数据再解码为字符串(推荐,常用)
print(response.content.decode()) # decode()括号里面不写就默认用utf8字符集