Python爬虫—requests模块爬取网页-1

小卷不秃

已于 2024-04-21 18:19:59 修改

阅读量255

点赞数 5

文章标签： python 爬虫开发语言

于 2024-04-21 16:55:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2202_75381448/article/details/138035560

版权

本文介绍了Pythonrequests模块的概念、作用，包括其在网络请求中的模拟浏览器功能。详细讲述了安装过程以及如何通过requests模块爬取搜狗和百度首页的页面数据，并演示了数据的持久化保存。后续将涉及数据处理内容。

摘要由CSDN通过智能技术生成

requests模块

1.概念：

requests模块是python中原生的一款基于网络请求的模块，功能非常的强大，功能非常强大，简单便捷，效率极高。

2.作用：

模拟浏览器发送请求。

3.如何使用（requests模块的编码流程步骤）：

-（1）指定一个网址 url

-（2）发送请求 get or post

-（3）获取响应数据 response

-（4）持久化存储一般写入保存

4.环境安装

在pycharm 的终端进行安装代码如下：

pip install requests

或者在pycharm的设置里找到python解释器，在这里进行安装，点击加号，然后搜索requests进行安装。

5.实战编码

-需求：爬取搜狗首页的页面数据。

代码如下：

import requests

#指定 url
url = 'https://www.sogou.com/'

#发起请求 这里使用 get 请求  get 请求会返回一个响应对象
#获取响应数据
response = requests.get(url=url)

#获取响应数据.text返回的是字符串形式的响应数据
page_text = response.text
print(page_text)

#持久化保存数据
with open('./sogou.html','w',encoding='utf-8') as fp:
    fp.write(page_text)

print("爬取数据结束！")

爬取后，目录里会出现一个html文件。

点击进去，在右上角会有一个html文件的打开方式。该文件和代码读取打印的运行结果是一致的。

你也可以使用这个方法去爬取百度的网页源码进行尝试！！！后续我们会讲解如何对爬取的数据进行处理等操作。

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小卷不秃 CSDN认证博客专家 CSDN认证企业博客

码龄2年

6: 原创

137万+: 周排名

11万+: 总排名

4174: 访问

: 等级

118: 积分

48: 粉丝

48: 获赞

4: 评论

41: 收藏

私信

关注

热门文章

最新评论

Python爬虫—requests模块爬取网页-1
CSDN-Ada助手: 恭喜您写了第三篇博客！看来您对Python爬虫的学习进展顺利，文章内容也很有启发性。接下来建议可以深入研究requests模块的更多功能，或者尝试结合其他模块进行更复杂的爬虫任务，不断挑战自己，不断进步。期待看到您更多精彩的作品！加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Python爬虫—requests模块爬取网页-2
CSDN-Ada助手: 恭喜您写了第四篇博客！看来您对Python爬虫的学习越来越深入了呢。接下来，我建议您可以尝试使用BeautifulSoup或Scrapy等更高级的库或框架，来进一步提升爬虫的功能和效率。期待您的下一篇作品，加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
matlba关于Dijkstra算法（暂时不太懂，学会了再说）
CSDN-Ada助手: 恭喜你写了第二篇博客！持续创作是一种很好的学习方式，不断总结和分享经验可以帮助巩固知识。关于Dijkstra算法，虽然现在可能还不太懂，但学习是一个逐步积累的过程，坚持下去一定会有收获的！除了掌握Dijkstra算法，你还可以尝试学习其他图论算法，比如BFS、DFS等，这些算法在解决实际问题时也非常有用。加油！期待你更多的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
数据结构实训（Java实验一线性表-顺序表的基本操作）
CSDN-Ada助手: 非常棒的博文！你的标题和摘要非常清晰地介绍了这篇博文的内容，让读者能够快速了解你所要讲解的内容。我鼓励你继续创作，因为你的博文对于初学者来说非常有帮助。除了顺序表的基本操作，你还可以扩展介绍一些其他常用的数据结构，比如链表、栈和队列等。这些数据结构在实际的开发中非常常见，并且对于进一步提升你的编程技能也非常有帮助。此外，你还可以介绍一些与数据结构相关的算法，比如排序算法和查找算法。这些算法是实际开发中非常重要的一部分，了解它们将使你能够更好地解决实际问题。总之，我非常期待你未来的博文，希望你能够继续分享你的知识和经验。谦虚地说，你的博文已经很不错了，但还有很多扩展的知识和技能等待你去探索和分享。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。