python2中,response.content类型为str,response.text类型为unicode。
如果请求的网站没有设置编码方式,就是默认编码方式为ISO-8859-1,只要设置response.encoding="utf-8",response.content和response.text打印出来的都是解码后的内容;如果网站设置了编码方式,一般都会设置为utf-8,那么直接打印response.content和response.text即为解码后的内容。
python3中,responnse.content为bytes类型,response.text为str类型。
response.content.decode()打印出来的是解码后的中文,而response.text在请求的网站没有设置编码的情况下需要设置response.encoding="utf-8",然后打印response.text即为解码后的中文;如果网站设置了编码方式为utf-8,则直接打印response.text即为解码后的中文。