1.3 爬虫的请求与响应

最新推荐文章于 2024-07-31 15:55:27 发布

皮卡橘橘

最新推荐文章于 2024-07-31 15:55:27 发布

阅读量233

点赞数

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/qq_40580037/article/details/104042228

版权

Python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

# requests 请求和相应 通常：通过浏览器 python:脚本发送 .模拟浏览器请求环境，获取数据
# 数据类型：html xml text img music 视频
# 自动化脚本
# 爬虫：目标和分析、实施

import requests

# 1.发起请求：http协议
# GET：地址栏请求，可以携带数据（大小限制），数据显示
# POST：可以携带数据（大小无限制），数据隐式
# 两种方式传参不同
resp_get_1=requests.get(url="http://httpbin.org/get",params={"name":"xiaoming"})
resp_get_2=requests.post(url="http://httpbin.org/post",data={"name":"xiaoming"})

# 2.传RUL参数,字典存储
# GET params={}
# POST data={}

# 3.查看请求地址
url_get_1 = resp_get_1.url
print(url_get_1)
url_get_2 = resp_get_2.url
print(url_get_2)
# https://maoyan.com/?name=xiaoming ？表示携带参数name=value &间隔 name=value

# 4.查看状态码 ：成功：200 ；无法加载:404/403； 服务器异常：500,505；
print(resp_get_1.status_code,resp_get_2.status_code)

# 5.编码格式，中文乱码
resp = requests.get(url="http://www.baidu.com/")
coding = resp.encoding = "utf-8"
print("编码： ", coding)

# 6.获取相应数据
text = resp.text  # 文本
print(text)
content = resp.content  # 二进制
print(content)

# 7.
#  headers
url = "http://www.qianlima.com/"
# 冒号放引号外面，它为字典结构
head = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36"
}
resp = requests.get(url=url,headers=head)
print(resp.status_code)

# 8.IP代理
# 9.设置超时代理
proxies={"http":"110.83.46.180","https":"110.83.46.180"}
resp = requests.get(url=url, headers=head, proxies=proxies, timeout=10)
print(resp.status_code)

皮卡橘橘

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1.3 爬虫的请求与响应

# requests 请求和相应通常：通过浏览器 python:脚本发送 .模拟浏览器请求环境，获取数据# 数据类型：html xml text img music 视频# 自动化脚本# 爬虫：目标和分析、实施import requests# 1.发起请求：http协议# GET：地址栏请求，可以携带数据（大小限制），数据显示# POST：可以携带数据（大小无限制），数据隐式...
复制链接

扫一扫

专栏目录