在win10利用Python3.6编写批量下载图片的小程序

import urllib.request
import os
  
#用于获取煎蛋网页面的函数
def url_open(url):
    req = urllib.request.Request(url)
    #添加header信息
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')
    response = urllib.request.urlopen(req)
    html = response.read()
    return html

#用于从煎蛋网的网页中获取页面的地址的函数
def get_page(url):
    #将网页解码为Python能够处理的Unicode编码
    html = url_open(url).decode('utf-8')
    a = html.find('current-comment-page')+23
    b = html.find(']', a)
    print('总共有%s页图片'%html[a:b])
    return html[a:b]

#用于从煎蛋网的页面中找到图片地址的函数
def find_imgs(url):
    html = url_open(url).decode('utf-8')
    img_addrs = []
    #find函数若找不到要找到的字符串则会返回-1
    a = html.find('img src=')
    while a != -1:
        #给定.jpg的寻找范围,注意不要的太大
        b = html.find('.jpg', a, a+100)
        #如果顺利找到.jpg,说明找到了完整的图片的地址,则进行保存
        if b != -1:
            #对图片进行保存时要格外注意,因为现在使用了泛解析,有的地址不会
            #明确给出http的协议名,有的地址有会给出http,
            #这对于我们的抓取带来了一定的麻烦,因此我们要分两种情况进行讨论
            #这样才不会出现地址错误的异常
            if 'http' not in html[a+9:b+4]:
                img_addrs.append('http:'+html[a+9:b+4])
            else:
                img_addrs.append(html[a+9:b+4])
        else:
            #如果找不到.jpg,则应将b+9,因为下一次循环是从这一次结束开始的
            #如果不进行这个操作,则b=-1,则无法进行下一次寻找,之所以加9
            #是因为img src="正好是9个字节
            b=a+9
        #继续进行下一次寻找,只有一个参数,表示从这个点开始下一次寻找
        a = html.find('img src=', b)
    return img_addrs
#用于保存图片的函数
def save_imgs(folder, img_addrs):
    for each in img_addrs:
        #[-1]表示从右边数第一个参数
        filename = each.split('/')[-1]
        f = open(filename, 'wb')
        img = url_open(each)
        f.write(img)
def download_mm(folder = '煎蛋妹子图', pages = 0):
    #在当前的文件夹(python.exe所在的文件)下创建新的文件夹
    os.mkdir(folder)
    #将目录切换到该文件夹
    os.chdir(folder)

    url = 'http://jandan.net/ooxx/'
    #这里的地址是一层套着一层
    #页面的地址在网页中抓取
    #而页面中的图片在在页面的地址下抓取
    #注意层层递进的关系
    page_num = int(get_page(url))
    a = int(input('总用抓取多少页图片:'))
    pages = a
    for i in range(pages):
        #使用循环获取10页的内容
        page_num -= 1
        #获取每一页的地址
        page_url = url + 'page-' + str(page_num) + '#comments'
        #在每一页中找到图片
        img_addrs = find_imgs(page_url)
        #保存图片
        save_imgs(folder, img_addrs)
if __name__ == '__main__':
    download_mm()

效果如下图所示,有多少页图片就可以抓多少,抓取的图片保存在程序的同级目录下的文件夹《煎蛋妹子图》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
图片批量裁剪器(精华版)是 一款功能丰富、实用、应有尽有的图片/视频批量裁剪、水印、转换、更名,以及其他处理的专业工具!批量处理时不低于5万个文件。 以管理员身份和兼容xp3模式下运行,可支持win7,win8,win10,64位。 图片批量裁剪器(精华版)功能 1. 支持常见图片类型如bmp,jpg,tif,gif,png,支持部分非常见图片类型,如PSD,PCX,ICO,Pdf,动态Gif等等;支持对大多数常见的音频/视频文件格式的裁剪、转换、水印、分割、合并等; 2.提供对图片文件的丰富多彩实用的各种批量裁剪模式,如相对、绝对、固定、大小、等分/非等分分切、分隔、同比/非同比缩放、拼接/无缝拼合、贴边等等几百种裁剪处理功能; 支持圆角矩形/椭圆形/圆形/任意角度裁剪,支持自定义圆角矩形半径裁剪; 3.其他更丰富的裁剪功能,请参见主页说明或程序,比如:提取图片上的文字并保存先裁剪后加水印一步到位忽略处理过的文件夹手动指定裁剪区域多裁剪区域裁剪打印二维码图片转Pdf 过滤小图或缩略图 AB文件夹配对拼合 …… 内置其他功能列表: 1.图片烙制水印(文字水印,图片水印,淘宝卖家专用水印,以及其他上百种水印功能模式供选择,特别如以拍摄日期作为文字水印,递增数字水印等等,批量制卡证等) 2.图片旋转及格式转换(特别功能如智能扳正) 3.图片亮度/对比度调整 4.图片压缩(特色功能如保留Exif信息的压缩) 5.定制图片大小/尺寸(特色功能如能按指定的文件大小压缩,比如压缩到120kb左右,仅压缩大图,小图忽略压缩等) 6.图片像素筛查(从海量图片中筛查出满足条件的图片供删除、移动、复制、更名等) 7.(图片)文件时间属性修改(比如更改拍摄日期,没有做不到只有想不到) 8.图像综合处理 9.(图片)文件批量更名(强大丰富的多种文件批量更名功能) 10.文件随机/顺序/定时抽取分发(将海量文件复制或移动到指定的文件夹中) 11.证件照批量更换背景颜色 12.色块/色条魔术棒裁剪,颜色替换 13.音视频裁剪/分割/合并/转换/加水印/录音/录像 14.批量替换图片中的图片或文字 15.图像批量组合排版 16.证件制作排版(广告公司实用) 17.Jpg图片Exif信息编辑器 18.重复或相似图片批量查找 19.相对/绝对/固定裁剪简易兼容备用版 20.Jpg转视频avi或其他(影楼后期制作DV工具) 21.图片批量浏览挑拣器(影楼客户自选照片实用) 22.图片批量叠加/混合 23.视频批量加密(特色功能如用户可自行在线找回播放密码,一机一码,一视频一码) 24.账号、密码批量管理小秘书(管理你各种账号密码,完全安全加密) 25.动态Gif图片裁剪、水印;图片压制成动态Gif(按时间轴裁剪,裁剪后的gif仍然是动画模式) 26.音频片段截取助手 27.广告喷绘大图专用分切器(喷绘行业专用) 图片批量水印裁剪器 v6.0.20161008精华版更新内容: 1.新增动态Gif水印区域批量涂抹模糊,或者图片水印区域批量涂抹功能; 2.修正水印添加模块中,还原或重设DPI功能时失效异常的问题; 3.在水印批量添加模块中,新增还原原图DPI以及转为CMYK印刷颜色模式的新功能; 4.新增批量生成二维码图片的功能; 5.新增图片裁剪/缩放/格式转换/添加水印等单张综合处理功能模块; 6.修正先选择后裁剪功能实现的问题; 7.新增批量对动态Gif文件指定水印区域模糊化处理功能; 8.新增定时对指定的目录中的图片挂机无人值守自动裁剪功能,忽略已处理过的图片文件; 9.新增纯文字水印添加功能模块; 10.新增学生证件照排版和学生胸卡排版制作打印功能模块; 11.改进修正Jpg系列图片转视频功能,并新增同时给转换后的视频叠加音频的功能; 12.修正改进动态Gif裁剪、水印功能模块; 13.改进跟图片OCR文字识别的有关问题和功能; 14.新增备用下载服务器和网络登录版; 15.修正精确去片头片尾功能; 16.修正某些音频视频文件播放时间不足一秒时无法加载入文件列表的异常; 17.修正媒体批量合并功能模块全部失效的问题; 18.新增以文件夹名作为动态文字水印的功能。 图片批量裁剪器(精华版)截图

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Auto FAE进阶之路

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值