day02 - 爬虫之requests的基本使用

本文详细介绍了Python requests库的使用,包括发送GET和POST请求,设置请求头、参数、代理,处理cookie和session,SSL证书验证以及超时设置。还探讨了模拟登录、URL编码解码以及页面重试策略。
摘要由CSDN通过智能技术生成

一、发送get请求

  • response = requests.get(url,[data=data,parment=parment,header=heder])
import requests

response = requests.get('http://www.baidu.com/')    # 请求百度首页
print(response.status_code)     #返回整型数据

  • ①header、parment和data的类型为字典型
    ②header中传递浏览器的请求头,主要让服务器认为此请求是浏览器客户端发送的,而非程序实现的而发送
    ③请求返回的response是一个对象

二、响应response常用的方法

  • response.text
    以字符串方式返回响应的内容
  • respones.content
    以字节bytes方式返回响应的内容
  • response.status_code
    返回响应的状态码
  • response.request.headers
    返回请求的头部
  • response.headers
    返回响应的头部
  • response.request.url
    返回请求的url
  • response.url
    返回响应的url
  • response.cookies
    返回响应的cookie值
    reqeusts.util.dict_from_cookiejar(response.cookies)
    返回响应的cookie值的字典形式
import requests
response = requests.get('http://www.baidu.com')    # 请求百度首页
print(response.content.decode())          #解码响应数据并打印
print(response.status_code)             # 打印响应的状态码
print(response.request.headers)        #打印请求的头部
print(response.headers)               #打印响应的头部
print(response.request.url)          #打印请求的url
print(response.url)                  #打印响应的url
print(response.cookies)             # 打印响应的cookie值  
print( requests.utils.dict_from_cookiejar(response.cookies))  #打印字典形式的cookie值

运行结果

<!DOCTYPE html>
<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8><meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer><link rel=stylesheet type=text/css href=http://s1.bdstatic.com/r/www/cache/bdorz/baidu.min.css><title>百度一下,你就知道</title></head> <
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值