Python爬虫---requests模块

requests库

  • requests是爬虫常用模块,必须熟练掌握。
  • requests的底层实现是urllib
  • requests更加简单易用
  • requests能够自行帮助我们解压网页内容

requests库的作用

作用:发送网络请求,返回响应数据

request常用方法

  • response =requests.get(URL)
  • response = requests.get(url,headers=headers)
  • response = requests.get(url,headers=headers,proxies=proxy)
    三个输出均是状态码

response对象方法(response = requests.get(url,headers=headers))

  • response.text 返回unicode格式的数据(str),用于获取字符串,文本
  • response.content 返回字节流格式的数据,用于获取的是图片,或者文件
  • 二者获取的均是HTML代码
  • 实际上,response.text 和response.content 返回的HTML数据一样的,只是显示不一样
  • response.headers 返回响应头身份
  • response.request.headers 请求头响应

解决响应代码解析问题

  • response.content.decode(‘utf-8’) 手动进行解码

  • 使用时机:当对象是图片,音频或者视频等

  • response.encoding() = ‘编码’

  • 使用时机:当对象是字符串或者文本

例子

在这里插入图片描述
在这里插入图片描述

ip代理设置

设置代理是反反爬的一种方法,可以避免ip被封
在这里插入图片描述

requests 发送post请求

数据的请求一般在XHR选项里,以下举例上次用urllib的post请求,发现只有一条内容,很容易发现。
在这里插入图片描述

Form Data 表单

Form Data 表单是用于对URL发起post请求时作用于响应,例如网页账号密码登录的响应,网页翻译的响应

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值