【Python】3行代码，利用 requests 保存网页到本地

最新推荐文章于 2025-02-17 15:32:59 发布

题桥十三

最新推荐文章于 2025-02-17 15:32:59 发布

阅读量5.1k

点赞数 2

分类专栏： Python 入门文章标签： Python 入门 requests 保存网页

本文链接：https://blog.csdn.net/qq_38866586/article/details/100129427

版权

Python 同时被 2 个专栏收录

26 篇文章

订阅专栏

入门

5 篇文章

订阅专栏

导入 requests模块：

import requests

调用 get 方法：

r = requests.get('https://www.douban.com/')

将获得的 html 文件写入本地：

with open('test.html','w',encoding='utf-8') as f:
    f.write(r.text)

“test.html” 是文件名，一般情况下建议填写绝对路径。如果直接这样写，文件保存在当前目录。
encoding是必须的，因为在windows下面，新文件的默认编码是gbk，这样的话，python解释器会用gbk编码去解析我们的网络数据流txt，然而txt此时已经是decode过的unicode编码，这样的话就会导致解析不了

代码总结：

import requests
r = requests.get('https://www.douban.com/') # 豆瓣首页
with open('test.html','w',encoding='utf-8') as f:
    f.write(r.text)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

题桥十三

关注关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用 Python Requests 爬虫抓取并保存网页图片——完整实战教程

2201_76125261的博客

01-18

501

本文详细介绍了如何使用PythonRequests库抓取并保存网页上的图片。我们从提取网页中的图片URL到下载图片并保存到本地，逐步讲解了爬虫的实现方法。在实现过程中，我们还处理了图片下载的常见问题，并展示了如何批量下载图片、处理图片格式和避免文件重命名冲突。

requests获取保存网页代码

A__Rong的博客

10-21

5101

内容主要是使用python去获取网页的源代码并存储到本地文件中

参与评论您还未登录，请先登录后发表或查看评论

python+requests——读取二进制文件并保存在本地——一个应用程序作为示例

小白龙白龙马的博客

02-23

286

import requests url = 'https://www.python.org/ftp/python/3.8.1/python-3.8.1.exe' resp = requests.get(url) with open('C:\\Users\\del\\Desktop\\新建文件夹\\2.exe','wb') as f: f.write(resp.content) ...

Python实用技巧：轻松上手自动化数据爬取与存储

最新发布

这家伙很懒，什么都没有留下

02-17

1279

通过本文的介绍，你应该已经掌握了使用Python进行自动化数据爬取与存储的基本技能。从准备阶段的目标确定和工具安装，到编写爬虫程序、处理反爬虫机制、数据存储与处理，再到实战案例和优化维护，每一步都至关重要。希望这些知识和技巧能够帮助你在数据爬取的道路上走得更远，为数据分析和决策提供有力的支持。记住，数据爬取只是数据分析和挖掘的第一步。后续的数据清洗、分析、可视化等工作同样重要。只有综合运用这些技能，你才能从海量的互联网数据中提取出有价值的信息，为你的业务或研究带来真正的价值。

python requests 保存页面HTML代码

人生苦短，何妨一试

01-15

1964

import requests res = requests.get('http://sahitest.com/demo/selectTest.htm') res.encoding = 'utf-8' with open(r'HTML.html','w+') as f: f.write(res.text)

爬虫练习之-requests爬取网页并持久化保存

weixin_56655555的博客

01-26

869

响应文本存储在变量中的原因是为了更好地组织代码，为了在后续的代码中多次使用相同的文本内容而不需要重新发起请求。page_text = response.text#为什么不直接使用 response.text。# 如果文件已存在，则截断文件（即清空文件内容），然后写入新的内容。# 但是它是以二进制方式进行操作，适用于处理非文本文件，比如图片、音频等二进制文件。#'w' 表示以文本写模式打开文件。在这种模式下，如果文件不存在，则创建文件；# print(response.text)#这里可以选择不打印哦。

Python3使用requests包抓取并保存网页源码的方法

09-21

主要介绍了Python3使用requests包抓取并保存网页源码的方法,实例分析了Python3环境下requests模块的相关使用技巧,需要的朋友可以参考下

Python3爬虫学习之将爬取的信息保存到本地的方法详解

09-19

在Python3爬虫实践中，将爬取到的信息保存到本地是至关重要的步骤，这使得我们能够持久化数据，便于后续分析和使用。本篇将详细讲解如何将爬取的文本信息和图片存储到本地。首先，我们要了解如何操作.txt文件进行...

用Python下载一个网页保存为本地的HTML文件实例

09-20

在Python编程中，有时我们需要将网页内容保存到本地以便离线查看或进一步分析。这个过程通常涉及使用HTTP请求获取网页源代码并将其写入HTML文件。在这个实例中，我们将探讨如何利用Python的`urllib.request`库来实现...

Python利用requests模块下载图片实例代码

09-18

标题中提到的知识点是Python中利用requests模块下载图片的技术方法，这是一种通过Python编程实现从互联网上获取并保存图片到本地的操作。requests模块是Python中一个非常流行且强大的HTTP库，它允许用户通过简单的...

Python3 requests文件下载期间显示文件信息和下载进度代码实例

09-18

这个实例代码展示了如何利用`requests`库实现文件下载，同时在下载过程中提供反馈，这对于大型文件下载尤其有用，因为用户可以看到下载进度，知道何时可以完成。这种方法不仅可以应用于个人项目，还可以在企业级应用...

requests-html

05-09

github上的大神封装，都不需要伪装useragent了，它都帮你伪装了。里面还使用了异步，亲测：特别是在循环中开启时，比单独用requests发送请求快了三分一以上。

第1关：获取超文本文件并保存至本地

qq_63600514的博客

12-06

1130

本关任务：本关我们将使用Python程序，实现通过网页的url，获得服务器返回的超文本文件，并保存为文本文件。# 请按下面的注释提示添加代码，完成相应功能。# 请按下面的注释提示添加代码，完成相应功能。# 2.将html保存到文件文件。# 1.获取网页文件并返回。

html js获取session_requests-html：最简单的爬虫框架，看完你就会了

weixin_39778218的博客

11-26

480

很多朋友都听说过Python的大名，而Python也拥有众多的爬虫框架，其中最简单的莫过于requests-html了。它和著名的网络请求库requests是同一个作者，着重于XML数据提取，可以说是最简单的爬虫框架了。安装requests-html安装这个类库非常简单，直接通过pip就可以安装了。pip install requests-html开始使用requests-html用起来也十分简单...

python requests保存网页文件参数总结

qq_29880515的博客

12-20

824

一： r= requests.get(url,headers=headers,stream=True) 官方文档：如果你在请求中把 stream 设为 True，Requests 无法将连接释放回连接池，除非你消耗了所有的数据，或者调用了 Response.close。这样会带来连接效率低下的问题。如果你发现你在使用 stream=True 的同时还在部分读取请求的 body（或者完全没有读取...

Python使用requests爬取一个网页并保存

weixin_30814223的博客

05-22

1058

#导入 requests模块import requests #设置请求头,让网站监测是浏览器 headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3573.0 Safari/537.36', } # ...

Python3+Requests-HTML+Requests-File解析本地html文件

weixin_30883271的博客

01-07

1748

一、说明解析html文件我喜欢用xpath不喜欢用BeautifulSoup，Requests的作者出了Requests-HTML后一般都用Requests-HTML。但是Requests-HTML一开始就是针对Requests从网络请求页面计的，并不能解析本地html文件。想用Requests-HTML解析本地html文件，我们可借助Requests-File库实现。 ...

python3的requests模块下载图片到本地

執筆冩回憶

08-23

6748

import requests # 图片地址 url = 'http://www.open-open.com/bbs/uploadImg/20160107/20160107133856_341.jpg' html = requests.get(url) # 将图片保存到D盘 with open("D:/1.jpg","wb")as f: f.write(html.content) ...

python requests post和get请求，并把结果写入json文件中

Learning from the mistakes

05-07

6708

今天在分析网页的时候，发现需要利用requests请求，得到数据，然后这会经常用到，虽然简单，但是容易忘记，所以我这里记录一下我用的python requests的demo文件 post请求 import requests,json headers = { "accept": "*/*", "accept-encoding": "gzip, deflate, br", "accept-la...

利用requests库请求网页超文本文件并保存至本地头歌

11-22

在Python中，你可以使用requests库来发送HTTP请求，并将获取到的网页内容保存为本地文件。以下是一个简单的步骤示例：首先，你需要安装`requests`库，如果你还没有安装，可以使用以下命令安装： ```bash pip install requests ``` 然后，你可以使用以下代码来获取网页内容并保存到本地： ```python import requests # 请求URL url = "http://example.com" # 替换为你想要下载的网页地址 # 发送GET请求 response = requests.get(url) # 检查请求是否成功，状态码200表示成功 if response.status_code == 200: # 将响应内容保存为本地文件，文件名可以自定义 with open("page_content.html", "wb") as file: file.write(response.content) print(f"网页已成功保存为page_content.html") else: print(f"请求失败，状态码：{response.status_code}")