七、爬虫入门(总结)

requests模块

发送请求获取响应

1. 发送请求的方法
  • requests.get(url)
  • requests.post(url)
  • requests.session().get(url)
  • requests.session().post(url)
2. 发送请求方法的参数
  • headers={请求头}
  • cookies={cookies}
  • params={查询字符串}
  • data={post请求独有的请求体}
  • timeout=3 # 最大超时时间3秒
  • verify=False # 忽略ssl安全认证
3. response响应对象常用属性
  • response.url
  • response.status_code
  • response.headers # {}
  • response.request.headers # {}
  • response.cookies # cookieJar
  • response.request._cookies # cookieJar
  • response.text # str
  • response.content # bytes
4. 解决中文乱码
  • response.content.decode(utf8)

ascii gbk gb2312 iso-8859-1

5. requests.session()的作用

能够自动处理cookies,达到状态保持的目的

  • 发送请求时,会自动带上前次的cookies
  • 获得响应时,会自动保存被set的cookie
6. cookieJar和cookies_dict互相转换
  • cookies_dict = requests.utils.dict_from_cookiejar(response.cookies)
  • cookies_jar = requests.utils.cookiejar_from_dict(cookies_dict)
7. 关闭warning级别的提示信息
  • requests.packages.urllib3.disable_warnings()
8. retry的是使用
  • retrying.retry装饰器能够让被装饰的函数在发生异常时,按规定的此时进行重试
from retrying import retry
	@retry(stop_max_attempt_number=3)
	def func():pass
	# stop_max_attempt_number=3表示重试最多3次
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值