Python requests模块

一、requests模块简介

requests模块是一个第三方模块,需要在python环境中安装:

pip install requests

该模块主要用来发送 HTTP 请求,requests 模块比 urllib 模块更简洁。

requests模块支持:

  • 自动处理url编码
  • 自动处理post请求参数
  • 支持文件上传
  • 支持自动响应内容的编码
  • 自动实现持久连接keep-alive
  • 简化cookie和代理操作等

1、基本步骤

requests模块使用的基本步骤:

# 导入模块
import requests

# 目标url
url = 'https://www.baidu.com'

# 向目标url发送请求方法。比如:get/post等
response = requests.get(url)

# 打印响应内容
print(response.ok)  # True
print(response.status_code)  # 200
print(response.url)  # https://www.baidu.com/
print(response.apparent_encoding)  # utf-8
print(response.text)
print(response.content.decode())

2、requests方法

requests的请求方法有:

在这里插入图片描述

参数说明:

  • method:请求方法。
  • url:请求url。
  • params:请求url参数。比如:get参数。
  • data:请求要发送到指定 url 的字典、元组列表、字节或文件对象等。比如:post参数数据。
  • json:请求要发送到指定 url 的 JSON 对象。比如:post参数数据。
  • args:请求其他属性参数。比如 cookies、headers、verify、timeout等。

常见 args请求属性如下:

  • headers:请求头。
  • cookies:请求cookies
  • timeout:设置响应超时时间。
  • verify:这是本次请求是否进行证书校验。

3、response对象

每次调用 requests 请求之后,会返回一个 response 对象,该对象包含了具体的响应信息。响应信息如下:

在这里插入图片描述

3.1 response.text和response.content 的区别

(1)response.text

response.text

  • 类型:str
  • 解码类型: requests模块自动根据HTTP 头部对响应的编码作出有根据的推测,推测的文本编码。

(2)response.content

response.content

  • 类型:bytes
  • 解码类型: 没有指定

通过对response.content指定decode,来解决中文乱码。

response.content.decode() # 默认utf-8

response.content.decode('gbk') # 指定编码

二、get请求

get() 方法可以发送 GET 请求到指定 url,一般格式如下:

response = requests.get(url, params,args)

参数说明:

  • url参数:请求 url。
  • params:请求参数。比如:get参数。
  • args参数:请求其他属性参数,比如 cookies、headers、verify、timeout等。

1、不带参数请求

url = 'https://www.baidu.com'

# 不带参数的get请求
response = requests.get(url)

2、带参数请求

2.1 url携带参数

url = 'https://www.baidu.com/?p1=python&p2=java'

# url携带参数 get请求
response = requests.get(url)
print(response.url)  # https://www.baidu.com/?p1=python&p2=java

2.2 构建字典参数

url = 'https://www.baidu.com'
url_params = {'p1': 'python', 'p2': None, 'p3': 'java'}

# url携带字典参数 get请求,如果值为None的键不会被添加到url中
response = requests.get(url, url_params)
print(response.url)  # https://www.baidu.com/?p1=python&p3=java

注意:字典传递参数,如果值为None的键都不会被添加到 url中。

三、post请求

post() 方法可以发送 POST 请求到指定 url,一般格式如下:

response = requests.post(url, data={key: value}, json={key: value}, args)

参数说明:

  • url参数:请求 url。
  • data参数:请求要发送到指定 url 的字典、元组列表、字节或文件对象等。
  • json参数:请求要发送到指定 url 的 JSON 对象。
  • args参数:请求其他属性参数,比如 cookies、headers、verify、timeout等。

1、表单参数请求

方式1:

url = 'https://www.baidu.com'
payload = {'key1': 'value1', 'key2': None, 'key3': 'value3'}

# 表单参数请求
response = requests.post(url, data=payload)
print(response.url)  # https://www.baidu.com/
print(response.request.body) # key1=value1&key3=value3

注意:如果值为None的键都不会被传递。

方式2:

import requests
import json
  
url = 'https://www.baidu.com'
payload = {'key1': 'value1', 'key2': None, 'key3': 'value3'}
headers = {'content-type': 'application/json'}

# 表单参数请求
response = requests.post(url, data=json.dumps(payload), headers=headers)
print(response.url)  # https://www.baidu.com/
print(response.request.body)  # {"key1": "value1", "key2": null, "key3": "value3"}
print(response.request.headers) # {'User-Agent': 'python-requests/2.28.2', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive', 'content-type': 'application/json', 'Content-Length': '50'}

注意:如果值为None的键都会被传递,值为null。

2、Json参数请求

url = 'https://www.baidu.com'
payload = {"key1": "value1", "key2": None, "key3": "value3", "key3": 33}
headers = {'content-type': 'application/json'}

response = requests.post(url, json=payload, headers=headers)
print(response.url)  # https://www.baidu.com/
print(response.request.body)  # b'{"key1": "value1", "key2": null, "key3": 33}'
print(response.request.headers) # {'User-Agent': 'python-requests/2.28.2', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive', 'content-type': 'application/json', 'Content-Length': '44'}

3、添加请求属性参数实例

这里添加请求 timeout,cookies,headers。

url = 'https://www.baidu.com'
payload = {"key1": "value1", "key2": None, "key3": "value3", "key3": 33}
headers = {'content-type': 'application/json'}
cookies = {'testCookies_1': 'Hello_Python3', 'testCookies_2': 'Hello_Java'}

try:
    response = requests.post(url, json=payload, headers=headers, cookies=cookies, timeout=5)

    if response.status_code != 200: # 如果响应状态码不是 200,就主动抛出异常
        print('响应失败:status_code = ' + str(response.status_code))
        print('响应失败:' + str(response.reason))
    else:
        print("=====================")
        print(response.url)  # https://www.baidu.com/
        print(response.request.body)  # b'{"key1": "value1", "key2": null, "key3": 33}'
        print(response.request.headers)  # {'User-Agent': 'python-requests/2.28.2', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive', 'content-type': 'application/json', 'Cookie': 'testCookies_1=Hello_Python3; testCookies_2=Hello_Java', 'Content-Length': '44'}
    	print(response.request._cookies) # <RequestsCookieJar[<Cookie testCookies_1=Hello_Python3 for />, <Cookie testCookies_2=Hello_Java for />]>
except requests.RequestException as e:
    print("请求失败,异常信息e={}".format(e))
except:
    raise
finally:
    response.close()

四、利用requests.session请求

requests模块中的 Session类能够自动处理发送请求获取响应过程中产生的cookie,进而达到状态保持的目的。

作用及场景:

  • 自动处理cookie,即下一次请求会带上前一次的cookie
  • 自动处理连续的多次请求过程中产生的cookie

示例代码如下:

import requests

# 构造请求头字典
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36',
    'content-type': 'application/json'
}
cookies = {
    'testCookies_1': 'Hello_Python3',
    'testCookies_2': 'Hello_Java'
}

# 构造请求参数字典
data = {
    'authenticity_token': 'authenticity_token',
    'login': input('输入账号:'),
    'password': input('输入密码:')
}

# 实例化session对象
session = requests.session()

# 请求1
post_url = 'https://blog.csdn.net'
response1 = session.post(post_url, data=data, headers=headers, cookies=cookies)

print("==========session.post===========")
print(response1.url)
print(response1.request.body)
print(response1.request.headers)
print(response1.request._cookies)
print(response1.cookies)

# 请求2
get_url = 'https://blog.csdn.net'
# response2 = session.get(get_url, headers=headers)
response2 = session.get(get_url)

print("==========session.get===========")
print(response2.url)
print(response2.request.body)
print(response2.request.headers)
print(response2.request._cookies)

在这里插入图片描述

– 求知若饥,虚心若愚。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pythonrequests模块是一个用于网络请求的模块,主要用于模拟浏览器发送请求。相比于其他类似的模块,如urllib、urllib2、httplib等,requests模块更加简单、强大和高效。它提供了各种方法来发送不同类型的请求,如GET、POST、PUT、DELETE、HEAD、OPTIONS等。使用requests模块发送请求的基本步骤包括导入模块、指定目标URL、发送请求并获取响应,然后可以对响应进行操作,如获取响应状态码、URL、编码方式以及响应内容等。例如,可以使用requests.get()方法发送GET请求,使用requests.post()方法发送POST请求,以此类推。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [pythonrequests模块详解](https://blog.csdn.net/qq_44159028/article/details/120459524)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Python requests模块](https://blog.csdn.net/qq_42402854/article/details/129030329)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值