reqeusts模块的学习

最新推荐文章于 2024-07-09 15:32:01 发布

熊猫路人

最新推荐文章于 2024-07-09 15:32:01 发布

阅读量205

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/qq_36820328/article/details/104881490

版权

Python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

使用事前

pip install reqeusts

发送get, post请求, 获取响应

response = requests.get(url) #发送get请求,请求url地址对应的响应
response = requests.post(url,data={请求体的字典}) #发送post请求

response的方法

response.text
- 该方式往往会出现乱码.出乱码使用response.encoding=“utf-8”
response.content.decode()
- 把响应的二进制字节流转化为str类型

获取网页源码的正确打开方式(移动)

1.response.content.decode()
2.response.content.decode(“gbk”)
3.response.text

发送带header的请求

headers = {	
"User-Agent": "Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36"}
response = requests.get(url,headers=headers)

使用超时参数

requests.get(url,headers=headers,timeout=3) #3秒内必须返回响应,否则报错

retrying模块的学习

pip install retrying

import requests
from retrying import retry

'''
专门请求url地址的方法
'''
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'}

@retry(stop_max_attempt_number=3) #让被装饰的函数反复执行三次,三次全部报错才会报错,中间有一次正常,则会继续执行
def _parse_url(url):
    print("*"*100)
    response = requests.get(url,headers=headers,timeout=5)
    return response.content.decode()

def parse_url(url):
    try:
        html_str = _parse_url(url)
    except:
        html_str = None
    return html_str

if __name__ == '__main__':
    url = "http://www.baidu.com"
    print(parse_url(url))

熊猫路人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
reqeusts模块的学习

使用事前pip install reqeusts发送get, post请求, 获取响应response = requests.get(url) #发送get请求,请求url地址对应的响应response = requests.post(url,data={请求体的字典}) #发送post请求response的方法response.text该方式往往会出现乱码.出...
复制链接

扫一扫

专栏目录