python爬虫urllib3学习

最新推荐文章于 2024-04-10 08:38:26 发布

望尘莫及是你

最新推荐文章于 2024-04-10 08:38:26 发布

阅读量484

点赞数

文章标签： python 爬虫学习

本文链接：https://blog.csdn.net/qq_67516465/article/details/130475074

版权

学习python爬虫的urllib3的模块测试代码如下：

想要测试该模块的可以直接复制然后取消部分注释即可运行,在vscode中运行无报错,

import urllib3

# import json

# """ 发送网络请求 """
# url1='http://www.htttpbin.org/get'
# url2='https://www.httpbin.org/post'
# head={
#     'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36'
#     }
# # #get请求

# # #创建PoolManager连接池管理对象
# # pool=urllib3.PoolManager()
# # #使用一个对象向多个服务器发送请求
# # response1=pool.request(method='GET',url=url1,fields=None,headers=head)
# # response2=pool.request(method='GET',url=url1,fields=None,headers=head)
# # #method:请求方法,url:url地址,filed:设置请求参数,headers:设置请求头

# #post请求,与重试请求(当请求失败时客户端会根据重试请求的次数再此发送请求)

# urllib3.disable_warnings()#关闭ssl警告
# #创建PoolManager连接池管理对象
# pool=urllib3.PoolManager()
# params={'name':'jack','age':18}
# response1=pool.request(method='POST',url=url2,fields=params,headers=head)#默认重试请求一般为3次
# # response2=pool.request(method='POST',url=url2,fields=params,headers=head,retries=5)#设置重试请求为5次
# # response3=pool.request(method='POST',url=url2,fields=params,headers=head,retries=False)#关闭重试请求
# #method:请求方法,url:url地址,filed:设置为一个字典参数,headers:设置请求头

# #打印重试请求的值
# print(response1.retries.total)
# # print(response2.retries.total)
# # print(response3.retries.total)


# #处理相应内容
# #发送请求后,我们将得到一个HTTPResponse对象
# #获取响应头
# #使用info()或getheades()获取响应头(返回的数据为字典类型),再进行遍历得到每条响应头的内容
# res_head=response1.getheaders()#也可以使用info()方法获取响应头的所有信息
# for key in res_head.keys():#keys():返回字典所有的的键值
#     print(key,':',res_head.get(key))#get(key):返回字典中该键所对应的值


# #处理服务器返回的json数据
# js=json.loads(response1.data.decode('unicode_escape'))#HTTRPResponse对象的data属性是一个字节字符串,包含接收到的响应数据,若要其转换为字符串,可使用decode方法
# #loads函数可将json格式的字符串解码为python对象，
# #格式：json.loads(json_string,object_hook,parse_float,parse_int,parse_constant,object_pairs_hook),json_string为要转换的json字符串
# #dumps(obj,skipkeys=False,ensure_asicc=True,check_circular=True,allow_nan=True,cls=None,
#         # indent=None,separators=None,encoding='utf-8',default=None,sort_keys=False)函数用于编码
# print(type(js))
# print(js.get('form'))#form为返回的响应数据(参数)所对应的键
# print(js.get('form').get('name'))

# #二进制数据
# #使用open()函数将二进制数据转为图片
# #创建open对象
# # f=open('python.png','wb+')   
# # f.write(response.data)
# # f.close()#关闭文件                                            

#设置超时
#timeout对象
#创建timeout对象
#timeout=Timeout(connect=0.5,read=0.1)#连接超时与读取超时
#response=PoolManager(timeout=timeout)或response.request('get',url=url,timeout=timeout)

#设置代理
#创建ProxyManager对象(与urllib一样)、



#上传文件
#1.通过fields参数以元组的形式分别指定文件名,内容,以及文件类型
#2.request(body,headers),body：图片的二进制数据,headers：为其指定文件类型

若有任何问题，可以在评论区一起讨论,希望和大家一起进步!