网络爬虫抓取图片并保存到本地(re、urllib)
编写爬虫基本步骤:
1、根据URL获取得到网页的HTML源码
2、根据图片的URL在源码中的格式,编写正则表达式
3、从HTML中根据正则表达式解析出所有图片的URL,然后下载并保存
示例代码如下:(爬取遥感图像)
import re
import urllib.request
def getHtml(url):
page = urllib.request.urlopen(u...
原创
2019-11-19 21:42:51 ·
508 阅读 ·
0 评论