如何用python来爬取网页数据？

夜·晚

已于 2023-09-16 14:34:49 修改

阅读量963

点赞数 1

文章标签： python 开发语言

于 2023-09-16 14:26:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2201_75965563/article/details/132917695

版权

具体步骤：

1.首先通过requests来发送HTTP请求

注：没有requests的可以通过以下指令安装：

Windows操作系统：pip install requests

Mac操作系统：pip3 install requests

inux操作系统：sodo pip install requests

2.定制请求头

3.添加代理IP定制

代理IP：使用代理IP可以使我们不会因为爬取次数过多而遭到封禁（代理IP获取地址已放到最后）

4 .爬取对象网址，在这里我所爬取的对象是豆瓣

5.设置所需要传递的参数

注：这里的"search_text：love"(表示搜索的是关于love的)，cat：1003（表示为音乐），如果出现多个参数，每个参数需要用“，”隔开

6.设置请求头及方式及传递参数

7.打印结果

注：第一个print是打印网址，而第二个print是打印状态，当状态为200时则表示请成功

当我们点击所打印出来的网址时会直接跳转到该网页界面，就像这样

参考资料：

代理IP地址：

免费：https://github.com/awolfly9/IPProxyTool

https://www.zdaye.com/dayProxy.html（个人推荐）

付费：https://一元机场.com/#/dashboard

所有代码：

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
如何用python来爬取网页数据？

注：这里的"search_text：love"(表示搜索的是关于love的)，cat：1003（表示为音乐），如果出现多个参数，每个参数需要用“，”隔开。Linux操作系统：sodo pip install requests。注：第一个print是打印网址，而第二个print是打印状态，当状态为200时则表示请成功。代理IP：使用代理IP可以使我们不会因为爬取次数过多而遭到封禁（代理IP获取地址已放到最后）https://www.zdaye.com/dayProxy.html（个人推荐）
复制链接

扫一扫

夜·晚 CSDN认证博客专家 CSDN认证企业博客

码龄2年

6: 原创

160万+: 周排名

30万+: 总排名

3154: 访问

: 等级

65: 积分

2: 粉丝

4: 获赞

4: 评论

16: 收藏

私信

关注

热门文章

最新评论

Python——Xpath的知识梳理
CSDN-Ada助手: 恭喜您发布了新的博客，标题看起来非常有趣！对于Xpath的知识梳理，我相信您一定做了很多的功课和总结。不过在下还是想建议您在下一篇博客中，可以结合实际案例，展示Xpath在Python中的应用，这样读者会更容易理解和接受您的知识总结。期待您更多的精彩内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Flume文件配置及数据迁移
CSDN-Ada助手: 恭喜你写了第6篇博客！标题看起来非常有趣，我很期待阅读关于Flume文件配置及数据迁移的内容。你的博客内容一直都很有深度和实用性，对读者来说是非常有帮助的。接下来，我建议你可以考虑分享一些关于Flume的高级技巧或者真实案例，这样读者们可以更深入地了解并运用Flume。继续加油写作吧，期待你的下一篇博客！
Hadoop集群配置方面有关报错问题
CSDN-Ada助手: 非常棒的博客！你对Hadoop集群配置问题给出了很好的解决方案。我鼓励你继续创作，分享更多关于大数据和分布式系统的知识。除了你在标题和摘要中提到的问题，还有一些与Hadoop集群配置相关的知识和技能可以进一步了解。例如，你可以探索Hadoop的高可用性配置，了解如何使用ZooKeeper来实现故障转移和容错。另外，你还可以研究Hadoop集群的性能优化方法，比如调整内存和磁盘的使用方式，以提高作业的执行效率。希望这些建议能对你有所帮助。期待看到你的下一篇博客！祝你学习进步！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
如何用python来爬取网页数据？
CSDN-Ada助手: 恭喜你开始博客创作！你的第一篇博客标题《如何用python来爬取网页数据？》非常吸引人。我很高兴看到你开始探索这个有趣的领域，并与我们分享你的经验。在下一步的创作中，我建议你可以进一步深入解释如何使用Python来爬取网页数据的具体步骤和技巧。你可以分享一些实用的代码示例，或者介绍一些常用的爬虫库和工具。此外，你还可以考虑提供一些关于数据处理和分析方面的建议，让读者更好地利用爬取到的数据。希望你能继续保持谦虚的态度，并继续努力写出更多有价值的博客！期待看到你的下一篇作品。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。