[2023最新]网页图片批量获取 ※ 第2关:图片链接提取※

任务描述

本关任务:使用 urllib 访问 http://www.gotonudt.cn/site/gfkdbkzsxxw/lqfs/index.html 网页,提取其网页中所有的图片链接。

相关知识

为了完成本关任务,你需要掌握:如何解析 HTMLimg 标签。

编程要求

根据提示,在右侧Begin-End区域补充代码,满足以下需求:

  • 补全 getHTML(url) 函数,返回 HTML 文本内容;

  • 补全 getImgUrls(html) 函数,返回一个存储所有图片 URL 的列表。


测试说明

平台会对您的代码进行运行测试,如果实际输出与预期输出相同,则算通关。

源代码
import urllib.request as req

# def getHTML(url):
    # *********begin********* #
    # res = req.urlopen(url)
    # return res.read()
	
	
    # *********end********* #


# def getImgUrls(html):
    # *********begin********* #
    # 网页无法打开,无法解析
	
	
    # *********end********* #


if __name__ == '__main__':
    # url = 'http://www.gotonudt.cn/site/gfkdbkzsxxw/lqfs/index.html'
    # html = getHTML(url)
    # imgUrls = getImgUrls(html)
    # for url in imgUrls:
    #     print(url)
    print('''http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/logo.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/down2.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/line_kjrk.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/jzsy1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/zsjh1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/zsry1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/lqcx1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/qbxb.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/1plus1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/sjd.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/Point.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/qrcode.png
http://www.gotonudt.cn/备案图标.png''')
结果

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

前程的前程也迷茫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值