抓取网页上的图片
思路:网页(HTML)中的图片通常在img标签中,图片的链接通常在标签的src属性中,通过BeautifulSoup解析HTML,找到所有的img标签,获取每一个标签中的src的属性(url),下载,保存到本地。
# @author: huangyanli
# @date : 2018-05-09 18:45:35
# @QQ : 339600718
# @Email : 339600718@qq.com
# 抓取网站的所有<img>标签中的所有jpg图片
import urllib.request
from bs4 import BeautifulSoup
url = "http://theater.mtime.com/China_Guangdong_Province_Shenzen/"
# 获取网页源代码
html_source = urllib.request.urlopen(url).read().decode(