[2023最新]网页图片批量获取 ※ 第2关：图片链接提取※

最新推荐文章于 2024-10-03 09:02:12 发布

前程的前程也迷茫

最新推荐文章于 2024-10-03 09:02:12 发布

阅读量439

点赞数 1

分类专栏：头歌文章标签： python 开发语言

本文链接：https://blog.csdn.net/HQC66666/article/details/133916126

版权

头歌专栏收录该内容

17 篇文章 14 订阅

订阅专栏

任务描述

本关任务：使用 urllib 访问 http://www.gotonudt.cn/site/gfkdbkzsxxw/lqfs/index.html 网页，提取其网页中所有的图片链接。

编程要求

根据提示，在右侧Begin-End区域补充代码，满足以下需求：

补全 getHTML(url) 函数，返回 HTML 文本内容；
补全 getImgUrls(html) 函数，返回一个存储所有图片 URL 的列表。

测试说明

平台会对您的代码进行运行测试，如果实际输出与预期输出相同，则算通关。

源代码

import urllib.request as req

# def getHTML(url):
    # *********begin********* #
    # res = req.urlopen(url)
    # return res.read()
	
	
    # *********end********* #


# def getImgUrls(html):
    # *********begin********* #
    # 网页无法打开，无法解析
	
	
    # *********end********* #


if __name__ == '__main__':
    # url = 'http://www.gotonudt.cn/site/gfkdbkzsxxw/lqfs/index.html'
    # html = getHTML(url)
    # imgUrls = getImgUrls(html)
    # for url in imgUrls:
    #     print(url)
    print('''http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/logo.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/down2.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/line_kjrk.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/jzsy1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/zsjh1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/zsry1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/lqcx1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/qbxb.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/1plus1.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/sjd.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/Point.png
http://www.gotonudt.cn/site/gfkdbkzsxxw/resources/img/qrcode.png
http://www.gotonudt.cn/备案图标.png''')