python + urllib + BeautifulSoup 获取百度首页logo

本文介绍了如何利用Python的urllib库进行HTTP请求,然后通过BeautifulSoup解析HTML,定位并获取百度首页Logo的src属性,最后下载Logo图片。
摘要由CSDN通过智能技术生成

python + urllib + BeautifulSoup 获取百度首页logo

1、urllib库是python自带的库,不需要安装。
2、BeautifulSoup是第三方库,安装方法: pip install bs4

# coding = utf-8

from urllib.request import urlopen, urlretrieve
from bs4 import BeautifulSoup

# 请求获取html
html = urlopen('http://www.baidu.com/')
# BeautifulSoup解析html
obj = BeautifulSoup(html.read(), 'html.parser')

# 1、使用find_all函数获取所有图片的信息
imgs = obj.find_all('img')  # 返回的是一个列表
# print(imgs)
# 遍历打印每张图片的信息
# for i in imgs:
#     print(i)

# 经分析得出,其中有百度首页logo的图片,该图片的class(元素类名)是index-logo-src
# 2、获取logo图片的信息
logo_img = obj.find_all('img', class_='index-logo-src')
# 打印logo图片的信息
print(logo_img)
print(logo_img[0], type(logo_img[0]))

# 获取logo图片的src
# logo_src = logo_img[0].get('src')
logo_src = logo_img[0]['src']
# 打印logo的src
print(logo_src)

# 拼接logo图片的url
logo_url = 'http:' + logo_src
# 打印logo图片的链接
print(logo_url)

# 使用urlretrieve下载logo图片
urlretrieve(logo_url, filename='logo.png')
  • 8
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值