爬虫笔记1

最新推荐文章于 2024-09-14 14:25:22 发布

小强爱睡觉

最新推荐文章于 2024-09-14 14:25:22 发布

阅读量210

点赞数

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53437436/article/details/126092298

版权

本文介绍了使用Python进行网页爬取的基本步骤，包括指定URL、发送HTTP请求、获取响应数据和将数据保存到本地文件。示例代码展示了如何爬取搜狗首页的内容并存储为html文件，对于初学者来说是一篇基础的爬虫教程。

摘要由CSDN通过智能技术生成

简单的爬虫操作：

四步：

1. 指定url

2. 发送请求

3. 获取数据

4. 永久化存储

import requests

#指定url
url = 'https://www.sogou.com/'
#发起请求
response = requests.get(url=url)#response为get的相应对象
#获取相应数据
page_text = response.text
print(page_text)
#持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
    fp.write(page_text)
print("爬取数据结束！！！！")

小强爱睡觉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小强爱睡觉 CSDN认证博客专家 CSDN认证企业博客

码龄4年

37: 原创

38万+: 周排名

74万+: 总排名

3万+: 访问

: 等级

419: 积分

176: 粉丝

43: 获赞

4: 评论

189: 收藏

私信

关注

热门文章

最新评论

Vj数据结构实验1（二）
scufa: 噢，是请教一下
Vj数据结构实验1（二）
scufa: 你好，想请假一下，pailie（a,0,n-1）中，为什么是n-1呢？
Vj数据实验1（一）
小强爱睡觉: 使用b数组进行二进制模拟，从而实现对a数组所有子集的枚举，每一次枚举就进行子集的价值求解及与之前价值异或值进行异或
Vj数据实验1（一）
m0_73838553: 看不太懂，大佬能帮我解释一下吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。