任务描述
本关任务:使用 urllib
访问 http://www.gotonudt.cn/site/gfkdbkzsxxw/lqfs/index.html
网页,提取其网页中所有的图片链接。
相关知识
为了完成本关任务,你需要掌握:如何解析 HTML
的 img
标签。
编程要求
根据提示,在右侧Begin-End
区域补充代码,满足以下需求:
-
补全
getHTML(url)
函数,返回HTML
文本内容; -
补全
getImgUrls(html)
函数,返回一个存储所有图片URL
的列表。
测试说明
平台会对您的代码进行运行测试,如果实际输出与预期输出相同,则算通关。
源代码
import urllib.request as req
# def getHTML(url):
# *********begin********* #
# res = req.urlopen(url)
# return res.read()
# *********end********* #
# def getImgUrls(html):
# *********begin********* #
# 网页无法打开,无法解析
# *********end********* #
if __name__ == '__main__':
# url = 'http://www.gotonudt.cn/site/gfkdbkzsxxw/lqfs/index.html'
# html = getHTML(url)
# imgUrls = getImgUrls(html)
# for url in imgUrls:
# print(url)
print('''http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/logo.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/down2.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/line_kjrk.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/jzsy1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/zsjh1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/zsry1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/lqcx1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/qbxb.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/1plus1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/sjd.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/Point.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/qrcode.png
http://www.gotonudt.cn/备案图标.png''')