url="http://www.baidu.com"
import requests
rep=requests.get(url)
rep.text
'\r\n
ç\x99¾åº ¦ä¸\x80ä¸\x8bï¼\x8cä½\xa0å°±ç\x9f¥é\x81\x93在requests中发生什么方式的请求就使用 reuquest.方式 方式可以是get/post/put.....
在requests库中对返回数据的操作
读取返回数据:text属性、content属性。其中text属性读取是以猜的方式读取字符串,因此可能出现没有解码的数据,我们可以用content属性设置解码的方式。
content返回数据类型为bytes,其中我们使用decode进行解码,解码方式由网页的编码方式而定,编码的方式一般在网页meta标签的charset属性处
例子:
url="http://www.baidu.com"
rep=requests.get(url)
#使用text获取数据
rep.text
...前面省略
ç\x99¾åº¦ä¸\x80ä¸\x8bï¼\x8cä½\xa0å°±ç\x9f¥é\x81\x93#使用content获取数据并进行解码
rep.content.decode('utf‐8')
...前面省略
百度一下,你就知道查看编码方式:encoding属性
url="http://www.baidu.com"
rep=requests.get(url)
rep.encoding
'ISO‐8859‐1'
对于ISO-8859-1的解码方式我们应该使用utf-8
查看响应状态码:status_code属性
url="http://www.baidu.com
rep=requests.get(url)
rep.status_code
200