抓取网页上的图片(一)

huangyanli0808

于 2018-05-11 18:34:29 发布

阅读量3.5k

点赞数 2

分类专栏： Python 文章标签： python爬虫抓取图片 beautifulsoup html request

本文链接：https://blog.csdn.net/huangyanli0808/article/details/80285311

版权

抓取网页上的图片

思路：网页（HTML）中的图片通常在img标签中，图片的链接通常在标签的src属性中，通过BeautifulSoup解析HTML,找到所有的img标签，获取每一个标签中的src的属性（url），下载，保存到本地。

# @author: huangyanli
# @date ： 2018-05-09 18:45:35
# @QQ : 339600718
# @Email : 339600718@qq.com
# 抓取网站的所有<img>标签中的所有jpg图片

import urllib.request
from bs4 import BeautifulSoup

url = "http://theater.mtime.com/China_Guangdong_Province_Shenzen/"
# 获取网页源代码
html_source = urllib.request.urlopen(url).read().decode(

最低0.47元/天解锁文章

huangyanli0808

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
抓取网页上的图片(一)

抓取网页上的图片思路：网页（HTML）中的图片通常在img标签中，图片的链接通常在标签的src属性中，通过BeautifulSoup解析HTML,找到所有的img标签，获取每一个标签中的src的属性（url），下载，保存到本地。# @author: huangyanli# @date ： 2018-05-09 18:45:35# @QQ : 339600718# @Email : 3...
复制链接

扫一扫