Python3.5下载网页图片

过程:

1.首先获取需要下载图片的src属性

    利用正则先获取img标签,利用标签的attrs属性获取到src属性地址,注意有些地址不全,在后面使用的时候要在前面加上网址

import requests,re,os
from bs4 import BeautifulSoup
def getPicUrls(url):
    try:
        r =requests.get(url)
        r.raise_for_status()
        soup = BeautifulSoup(r.text,'html.parser')
        html=soup.find('div',{'class':'wenzhangcontent'}).findAll('img')        
        return html
    except Exception as e:
        print(e)

2.open write来下载图片

    localPath = 'd:/py_pics/'
    if not os.path.exists(localPath):
        os.mkdir(localPath)
    domain ='http://www.lyjyfw.net/'
    picUrls=getPicUrls('http://www.lyjyfw.net/Html/News/201844/tR0454108.html') 
    for i,item in enumerate(picUrls):
        try:
            pic = requests.get(domain+item.attrs['src'],timeout=15)
            with open(localPath+'{}.jpg'.format(i),'wb') as f:
                f.write(pic.content)  #content写入的是二进制数
                print('成功下载第{:d}张图片:{:s}'.format((i+1),domain+item.attrs['src']))
        except Exception as e:
            print('下载第{:d}张图片失败:{:s}'.format((i+1),domain+item.attrs['src']))
            print(e)
            continue

阅读更多
个人分类: python
上一篇BeautifulSoup 正则表达式
下一篇pandas绘图总结(转载)
想对作者说点什么? 我来说一句

python客户端下载

2018年01月05日 27.68MB 下载

python down images

2010年10月14日 529B 下载

Python爬虫获取页面图片

2017年04月01日 708B 下载

没有更多推荐了,返回首页

关闭
关闭