如何入门爬虫2

最新推荐文章于 2024-07-12 17:59:12 发布

AS_BS

最新推荐文章于 2024-07-12 17:59:12 发布

阅读量449

点赞数

文章标签：爬虫 python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AS_BS/article/details/131042729

版权

在编写python爬虫程序时，只需要做以下两件事：

发送GET请求，获取HTML
解析HTML，获取数据

这两件事，python都有相应的库帮你去做，你只需要知道如何去用它们就可以了。

首先，发送HTML数据请求可以使用python内置库urllib，该库有一个urlopen函数，可以根据url获取HTML文件，这里尝试获取百度首页“https://www.baidu.com/”的HTML内容

# 导入urllib库的urlopen函数
from urllib.request import urlopen 
# 发出请求，获取html
html = urlopen("https://www.baidu.com/")
# 获取的html内容是字节，将其转化为字符串
html_text = bytes.decode(html.read())
# 打印html内容
print(html_text)

百度首页html是什么样的，如果你用的是谷歌浏览器，在百度主页打开设置>更多工具>开发者工具，点击element，就可以看到了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
如何入门爬虫2

首先，发送HTML数据请求可以使用python内置库urllib，该库有一个urlopen函数，可以根据url获取HTML文件，这里尝试获取百度首页“百度首页html是什么样的，如果你用的是谷歌浏览器，在百度主页打开设置>更多工具>开发者工具，点击element，就可以看到了。这两件事，python都有相应的库帮你去做，你只需要知道如何去用它们就可以了。
复制链接

扫一扫

AS_BS CSDN认证博客专家 CSDN认证企业博客

码龄1年

13: 原创

148万+: 周排名

79万+: 总排名

2782: 访问

: 等级

130: 积分

0: 粉丝

0: 获赞

8: 评论

0: 收藏

私信

关注

热门文章

最新评论

爬虫是什么
CSDN-Ada助手: 恭喜您写了第四篇博客，探讨了爬虫的概念和意义。作为初学者，您已经有了很不错的创作能力。接下来，建议您可以深入研究爬虫的实际应用，如何应用到实际工作中，以及如何应对爬虫的一些问题和挑战。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
如何入门爬虫1
CSDN-Ada助手: 非常感谢您的分享，恭喜您写了第5篇博客！阅读您的文章，我深深地感受到了您的热情和努力。您的文章内容通俗易懂，对于初学者来说非常有帮助。在这里，我要真诚地建议您可以继续深入研究爬虫的相关知识，分享您的经验和心得，让更多的人受益。谢谢您的付出，期待您的下一篇精彩博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
如何入门爬虫2
CSDN-Ada助手: 非常感谢用户一直以来的创作，特别是这篇关于爬虫入门的博客，对初学者来说非常有帮助。我们也期待用户继续分享更多关于爬虫的经验和技巧，可以考虑分享一些实战项目或者更深入的技术知识，让我们一起进步吧！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
如何入门爬虫3
CSDN-Ada助手: 恭喜您写了第7篇博客，内容也越来越深入了！入门爬虫确实需要不断学习和实践，而您的分享对于初学者来说一定很有帮助。希望您可以继续分享更多深入的爬虫技巧和应用案例，让我们一起学习进步！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
如何入门爬虫4
CSDN-Ada助手: 非常感谢您的分享，看到您已经写了第8篇博客，我为您感到骄傲和祝贺。您的经验和知识对于像我这样的新手来说非常有价值。希望您能继续分享您的经验和见解，不断提升自己的技能和知识。下一步的创作建议是可以多分享您的实战经验，帮助更多的人解决实际问题。再次感谢您的分享。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。