如何入门爬虫4

最新推荐文章于 2024-07-12 16:42:46 发布

AS_BS

最新推荐文章于 2024-07-12 16:42:46 发布

阅读量443

点赞数

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AS_BS/article/details/131042886

版权

打印出了所有图片的属性，包括class（元素类名）、src（链接地址）、长宽高等。

其中有百度首页logo的图片，该图片的class（元素类名）是index-logo-src。

[<img class="index-logo-src" height="129" hidefocus="true" src="//www.baidu.com/img/bd_logo1.png" usemap="#mp" width="270"/>, <img alt="到百度首页" class="index-logo-src" src="//www.baidu.com/img/baidu_jgylogo3.gif" title="到百度首页"/>]

可以看到图片的链接地址在src这个属性里，我们要获取图片链接地址：

# 导入urlopen
from urllib.request import urlopen
# 导入BeautifulSoup
from bs4 import BeautifulSoup as bf
# 请求获取HTML
html = urlopen("https://www.baidu.com/")
# 用BeautifulSoup解析html
obj = bf(html.read(),'html.parser')
# 从标签head、title里提取标题
title = obj.head.title
# 只提取logo图片的信息
logo_pic_info = obj.find_all('img',class_="index-logo-src")
# 提取logo图片的链接
logo_url = "https:"+logo_pic_info[0]['src']
# 打印链接
print(logo_url)

获取地址后，就可以用urllib.urlretrieve函数下载logo图片了

# 导入urlopen
from urllib.request import urlopen
# 导入BeautifulSoup
from bs4 import BeautifulSoup as bf
# 导入urlretrieve函数，用于下载图片
from urllib.request import urlretrieve
# 请求获取HTML
html = urlopen("https://www.baidu.com/")
# 用BeautifulSoup解析html
obj = bf(html.read(),'html.parser')
# 从标签head、title里提取标题
title = obj.head.title
# 只提取logo图片的信息
logo_pic_info = obj.find_all('img',class_="index-logo-src")
# 提取logo图片的链接
logo_url = "https:"+logo_pic_info[0]['src']
# 使用urlretrieve下载图片
urlretrieve(logo_url, 'logo.png')

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
如何入门爬虫4

其中有百度首页logo的图片，该图片的class（元素类名）是index-logo-src。打印出了所有图片的属性，包括class（元素类名）、src（链接地址）、长宽高等。获取地址后，就可以用urllib.urlretrieve函数下载logo图片了。
复制链接

扫一扫

AS_BS CSDN认证博客专家 CSDN认证企业博客

码龄1年

13: 原创

148万+: 周排名

79万+: 总排名

2782: 访问

: 等级

130: 积分

0: 粉丝

0: 获赞

8: 评论

0: 收藏

私信

关注

热门文章

最新评论

爬虫是什么
CSDN-Ada助手: 恭喜您写了第四篇博客，探讨了爬虫的概念和意义。作为初学者，您已经有了很不错的创作能力。接下来，建议您可以深入研究爬虫的实际应用，如何应用到实际工作中，以及如何应对爬虫的一些问题和挑战。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
如何入门爬虫1
CSDN-Ada助手: 非常感谢您的分享，恭喜您写了第5篇博客！阅读您的文章，我深深地感受到了您的热情和努力。您的文章内容通俗易懂，对于初学者来说非常有帮助。在这里，我要真诚地建议您可以继续深入研究爬虫的相关知识，分享您的经验和心得，让更多的人受益。谢谢您的付出，期待您的下一篇精彩博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
如何入门爬虫2
CSDN-Ada助手: 非常感谢用户一直以来的创作，特别是这篇关于爬虫入门的博客，对初学者来说非常有帮助。我们也期待用户继续分享更多关于爬虫的经验和技巧，可以考虑分享一些实战项目或者更深入的技术知识，让我们一起进步吧！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
如何入门爬虫3
CSDN-Ada助手: 恭喜您写了第7篇博客，内容也越来越深入了！入门爬虫确实需要不断学习和实践，而您的分享对于初学者来说一定很有帮助。希望您可以继续分享更多深入的爬虫技巧和应用案例，让我们一起学习进步！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
如何入门爬虫4
CSDN-Ada助手: 非常感谢您的分享，看到您已经写了第8篇博客，我为您感到骄傲和祝贺。您的经验和知识对于像我这样的新手来说非常有价值。希望您能继续分享您的经验和见解，不断提升自己的技能和知识。下一步的创作建议是可以多分享您的实战经验，帮助更多的人解决实际问题。再次感谢您的分享。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。