requests抓取二进制数据

最新推荐文章于 2022-11-23 16:48:59 发布

WindSearcher

最新推荐文章于 2022-11-23 16:48:59 发布

阅读量2.4k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/qq_40511966/article/details/103865443

版权

python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

想必大家思考过，我如果把网上的图片，视频爬下来，那我怎么保存在本地呢？因为图片，视频本身是二进制流。所以，想要抓取它们，就要拿到它们的二进制码。

以GitHub的站点图标为例。

from bs4 import BeautifulSoup
import requests, sys
import lxml

response = requests.get('https://github.com/favicon.ico')
#response.text为str类型
print(response.text)
print(response.content)

运行结果

前者出现乱码，是因为图片是二进制数据，所以前者打印转化为str类型，肯定会出现乱码呀。而后者结果带有一个b，代表是bytes类型的数据。

接着，我们把刚才提取的图片保存下来：

with open('favicon.ico','wb') as f:
    f.write(response.content)

同样的，音频和视频文件也可以这样获取。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

WindSearcher

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python爬虫编程思想（21）：使用requests网络库抓取二进制数据、提交POST请求和处理响应数据

一个被知识诅咒的人

09-08

921

目录 1. 抓取二进制数据 2. POST请求 3. 响应数据 1. 抓取二进制数据 get方法指定的URL不仅可以是网页，还可以是任何二进制文件，如png图像、pdf文档等，不过对于二进制文件，尽管可以直接使用Response.text属性获取其内容，但显示的都是乱码。一般获取二进制数据，需要将数据保存到本地文件中。所以需要调用Response.content属性获得bytes形式的数据，然后再使用相应的API将其保存在文件中。本例使用get方法抓取一个png格式的图像文件，并将其保存为

【Python爬虫系列教程 4-100】 Requests库详细使用，如何抓取网页，抓取二进制数据，添加headers和解决POST请求

weixin_54707168的博客

02-28

536

【Python爬虫系列教程 4-100】 Requests库详细使用，如何抓取网页，抓取二进制数据，添加headers和解决POST请求

参与评论您还未登录，请先登录后发表或查看评论

requests爬取二进制数据

qq_40769121的博客

10-29

1844

当我们了解到urllib的基本用法之后，发现其中确实有很多不方便的地方，比如处理网页验证和Cookies的时候需要写Opener 和Handler来处理。今天给大家加好更加强大requests库抓取简单的二进制数据： 1.下面以GitHub的站点图标来来一下：这边利用requests抓取站点图标，打印了Response的两个属性：text和content.运行结果如图：可以注意到，前者出现了乱码，后面出现了以b开头的数据（byte类型的数据）。因为图片是二进制数据，前面在打印的时候直接转换成str类

使用request下载二进制文件

weixin_31851145的博客

06-13

629

可以使用request.get方法。保存的时候注意使用content，不对下载内容做改变直接进行保存。 import requests r = requests.get('https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1592049860552&di=b98c5005a32ba52c8609f69edf5959c9&imgtype=0&src=http%3A%2F%2F

（呕心沥血）用HttpRequest对象获取服务端的二进制数据

jeff2033333的博客

11-18

2148

js框架很多，JQuery算是其中比较有趣的，AJAX功能用起来也挺方便，我手头的应用，视图层的交互和XML解析全靠它了。缺点不是没有，jq的AJAX请求函数只支持接收XML/HTML/JSON/JSONP格式的服务器数据。在普通情况下，我们往往只是用AJAX呼叫服务器获取相关文本、数值或XML这种结构化的文档，这些返回数据，说到底都是基于文本的，以至于给我们制造了一个错觉，即AJAX/X...

用mysql C api存取二进制数据

canlynetsky的博客

09-15

587

mysql的c接口，使用普通的query方法，很难获取到二进制数据。使用mysql_stmt_前缀的函数，用mysql_stmt_bind_result的方式，可针对各种类型的数据进行获取操作

HTTP二进制

03-30

在Python中，可以使用requests库，它同样提供了处理二进制数据的功能。在Node.js中，可以使用内置的http模块或axios库。提到的“bpmDemo”可能是一个与业务流程管理相关的示例项目，可能包含了处理HTTP二进制数据...

第一个python项目，使用requests抓取数据

最新发布

01-20

【标题】：“第一个Python项目，使用requests抓取数据” 在这个项目中，我们将探索如何使用Python的requests库来从网络上抓取数据。requests是Python中最常用的一个库，它提供了简单易用的API来发送HTTP请求，这...

python requests抓取one推送文字和图片代码实例

09-18

函数内部，通过requests.get发起GET请求获取图片内容，然后将图片的二进制数据写入到指定的文件路径中。通过异常处理可以确保在URL无效或网络问题发生时，能够输出错误信息并终止程序继续执行。在实例的后半部分，...

python requests post 二进制流_Python的requests如何同时post图片二进制流和json数据application/octet-stream...

weixin_39664136的博客

12-03

987

如何用post的方法以application/octet-stream的content-type提交json和文件呢，总是说文件类型错误写入图片该接口用于根据 spreadsheetToken 和 range 向单个格子写入图片。keyvalueAuthorizationBearer user_access_tokenContent-Typeapplication/octet-stream请求Bo...

Netty获取 post请求 body里面二进制流

qq_33620771的博客

05-02

1609

1from data方式提交数据读取方式废话不多说直接上代码 private HttpPostRequestDecoder decoder;//Handel私有变量 HttpRequest request = (HttpRequest) msg;//第一次连接建立 msg传过来的是HttpRequest decoder = new HttpPostRequestD...

接收后端返回的二进制流文件

weixin_42400404的博客

05-05

3613

先上代码：（params是我传给后端的数据，如果你不传值，可以忽略不计） let params1 = { uri : this.projectIconSend } this.$axios({ url: this.$api.newProjectShow, method: 'get', params:params1, res...

SpringBoot 使用 RestTemplate 发送 binary 数据流

Brave_heart4pzj的博客

08-29

4036

springboot

Python-爬虫（requests库、二进制数据(图片)获取，GET/POST请求、session请求）

dodamce的博客

08-31

2627

Python-爬虫（requests库、二进制数据(图片)获取，GET/POST请求、session请求）

springmvc接收参数的方法

zhangchunxiaow的专栏

11-22

1829

1.首先说下postman中 form-data、x-www-form-urlencoded、raw、binary对应的各种使用方法及区别 1、form-data: 就是http请求中的multipart/form-data,它会将表单的数据处理为一条消息，以标签为单元，用分隔符分开。既可以上传键值对，也可以上传文件。当上传的字段是文件时，会有Conte...

get 、post请求后台@RequestParam、@RequestBody 接收的方法集合

热门推荐

weixin_37270353的博客

11-14

3万+

post、get请求参数：数组、JSON对象、JSON字符串、地址栏 @RequestParam、@RequestBody 后端接收 //定义json对象，同时包含数组 var _queryData = { jflb:"婚姻家庭纠纷", zlay:"xxxxx", ...

requests上传二进制文本或者二进制附件 Python

weixin_54217201的博客

09-14

2791

第一个是文件，第二个是文本内容，如果你用requests中的files传值会发现解析不了，如图file数据传入了，但是createPublicityNoticeRequest值没有传入，我查了很多资料还是没有发现为什么，只能认为files不支持传递文本数据。它的接口是使用二进制的方式来发送的数据，使用requests中的files值无法实现该功能，在网上查找的有比较乱，因此在这里总结一下。这一串，boundary的值是随机的，不是固定的值，至于怎么生成的就没了解，这个值在怎么获取？

request.getParameter()方法的简单理解与运用

qq_54000767的博客

11-23

2万+

request.getParameter()方法:

Python 技术篇-获取requests里的二进制文本并保存为音频、图片文件，提取requests里的多媒体信息

小蓝枣的博客

06-23

8828

Python 技术篇-获取requests里的二进制文本并保存为音频、图片文件，提取requests里的多媒体信息。核心就是 request.content 保存的是 request 返回的二进制内容。 json 数据是保存在 request.text 里。 request.headers 可以看到表头信息。我们可以看到 request 返回的二进制类型， Content-Type 类型显示为 audio/mp3。即：音频类mp3格式。

数据载入与存储：文本、二进制、数据库及HDF5

二进制格式如pickle和feather，用于高效地存储和加载数据，特别是大数据集。pickle用于Python对象，而feather是一种跨语言的二进制格式，特别适合pandas DataFrame。与WebAPI交互通常涉及HTTP请求，Python的`...