常用方法
- print(response.read()) 读取内容,内容为字节类型
- print(response.readlines()) 按行读取,内容为字节类型
- print(response.getcode()) 获取状态码
- print(response.getheaders()) 获取头部信息
- print(response.geturl()) 获得当前的url
- print(response.read().decode()) read读取的数据是二进制,decode:二进制转utf-8(无参数默认)或者gbk
- url只能由特定得字符组成,字母、数字、下划线,如果出现其他的,比如$ 空格 中文等,就要对其进行解码
- .urllib.parse.quote(url) url编码函数,主要是将中文进行转化为%XXX
- urllib.parse.unquote(url) url解码函数,主要是将%XXX转化为指定字符
- urllib.parse.urlencode(data) 给一个字典,将字典拼接为query_string,并且实现了编码功能
爬取图片的两种方法
图片只能写入本地二进制格式
#图片只能写入本地二进制格式
base_url='图片链接'
1.response