python 爬取图片_Python实现千图成像:从图片爬取到图片合成

本文介绍了如何使用Python爬取英雄联盟皮肤图片,通过分析网页结构找出图片URL的规律,然后下载并合成千图成像。文章详细讲解了获取英雄和皮肤编号的过程,以及利用特定软件进行图片合成的步骤。
摘要由CSDN通过智能技术生成

cb9628a9ac43b378ef83ac9a820636a7.png

千图成像:用N张图片拼凑成一张图片。

实现原理:先将所要成像的图片转化成马赛克图片,然后从图库中用对应颜色的图片替换相应色块。

图库中的图片处理:标记图库中每张图片的混合颜色,用于替换目标色块,并记录每张图片的特征用于成像,增加成像质量。

起源

44be02ac4e084f380019939a973b0947.png

德莱文

22de04911161feb44fe41c7c2c215111.png

图片局部

295ff293d5235bf73bba46161de58405.png

英雄联盟-微博

很久前在刷微博的时候看到了这条,被他给震撼到了,图片是由LOL近千张皮肤图片组合构成的(难道这是用ps做的,还是一张张拼的,应该不可能吧),就在昨天突然就想起了这个事,就决定也做一个,随即便展开了行动。

搜到了这篇文章,看了下图片的构成,决定先取得所有皮肤的图片再说吧!便又开始了爬虫!

运行环境:

Python3.6.5 , pycharm-2018-1-2 , win10

爬虫思路

皮肤图片的来源问题,首先到官网去找了找,想到了道聚城皮肤专卖区,其中正好有所有我们需要的图片。

b6bb72b731778bbe82630de49f2d9d88.png

通过F12锁定图片取得了第一张图片的URL(https://game.gtimg.cn/images/daoju/app/lol/medium/2-122015-9.jpg)

fe70968d1a13baaa101881c29f337a7a.png

以此类推便可取得多个皮肤的URL,发现只有图中红框处不同

ab2f9583f76f75555d084199821653ca.png

尝试着改变红框内的数字,在改变后三位(122015-->122001)时,获得了另一张诺手的皮肤,基本可以确定后三位为皮肤编号,前面的数字为英雄编号,且皮肤编号必须为三位。

看到这里你可能会有所疑问,为什么不直接正则获取所需图片的URL呢?为什么要大费周章的寻找规律?

因为这个翻页式网站比较特殊,在翻页时URL并不会改变,所以无法通过常用方法获取所有皮肤。

那估计又有人要提出使用selenium库来模拟人使用浏览器获取所有图片,但是这会造成爬取图片的速度大大下降,只能作为下策(在这过程中了解到了八爪鱼,发现其原理类似于selenium,是模拟人操控浏览器,速度也是不容直视,虽然它能爬取近98%的网站),在博主能力有限的情况下选择了寻找规律之旅!

如果你有好的方法解决这个问题,可以在评论处提出,十分感谢!

接下来在知道了规律的情况下,那么如何获取每个不同英雄的编号呢?在其他博主的引导下,发现LoL资料库中有所有英雄的头像,通过F12的慢慢查找,发现了这个js文件!

3a19db677c35d28b2406f9538352cfd6.png

查看其preview,便可得到所有英雄编号,并测试发现可用!比如Ashe艾希的第一个皮肤对应编号按规律应该是22001,所以URL就是https://game.gtimg.cn/images/daoju/app/lol/medium/2-22001-9.jpg,

测试发现确实成功了!

7d954e04b8bff43003650689ab40f723.png

好了,到此为止网页分析到此结束了,终于可以编写代码了。

代码框架

1、获取英雄编号及皮肤编号(说明:关于皮肤编号并未找到每个英雄皮肤的数量,所以设置成查找所有001到015的图片,当然也可以更多020也行)

2、将编号导入图片URL(https://game.gtimg.cn/images/daoju/app/lol/medium/2-****-9.jpg )中, 生成Url_list。

3,根据URL来下载对应图片,并保存到本地。

4、完整代码
import requestsimport reimport os# # # # # # # # # # # # # ## title:获取LOL英雄皮肤图像  ## author:简书 Wayne_Dream  ## date:2018-7-5           ## # # # # # # # # # # # # #defgetHero_data():    try:        headers = {            'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'        }        url = 'http://lol.qq.com/biz/hero/champion.js'        r = requests.get(url, headers=headers)        r.raise_for_status()        r.encoding = r.apparent_encoding        text = r.text        hero_id = re.findall(r'"id":"(.*?)","key"', text)        hero_num = re.findall(r'"key":"(.*?)"', text)        return hero_id, hero_num    except:        return '卧槽,获取英雄编码失败!'defgetUrl(hero_num):    part1 = 'https://game.gtimg.cn/images/daoju/app/lol/medium/2-'    part3 = '-9.jpg'    skin_num = []    Url_list = []    for i in range(1, 21):        i = str(i)        if len(i) == 1:            i = '00'+i        elif len(i) == 2:            i = '0'+i        else:            continue        skin_num.append(i)    for hn in hero_num:        for sn in skin_num:            part2 = hn + sn            url = part1 + part2 + part3            Url_list.append(url)    print('图片URL获取成功')    return Url_listdefPicName(hero_id, path):    pic_name_list = []    for id in hero_id:        for i in range(1, 21):            pic_name = path + id + str(i) + '.jpg'            pic_name_list.append(pic_name)    return pic_name_listdefDownloadPic(pic_name_list, Url_list):    count = 0    n = len(Url_list)    try:        for i in range(n):            headers = {                'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'            }            res = requests.get(Url_list[i], headers=headers).content            if len(res) < 100:                count += 1                print('\r当前进度:{:.2f}%'.format(100*(count/n)), end='')            else:                with open(pic_name_list[i], "wb") as f:                    f.write(res)                    count += 1                    print('\r当前进度:{:.2f}%'.format(100*(count/n)), end='')    except:        return '卧槽,获取图片失败!'if __name__ == '__main__':    print('author:简书 Wayne_Dream:')    print('https://www.jianshu.com/u/6dd4484b4741')    input('请输入任意字符开始爬虫:')    if os.path.exists('D:\LOLimg_wayne\\') == False:        path = r'D:\LOLimg_wayne\\'        os.mkdir(path)        hero_id, hero_num = getHero_data()        Url_list = getUrl(hero_num)        pic_name_list = PicName(hero_id, path)        print('正在下载图片,请稍等。。。')        print('在' + path + '下查看...')        DownloadPic(pic_name_list, Url_list)        print('图片下载完毕')    else:        path = r'D:\LOLimg_wayne\\'        hero_id, hero_num = getHero_data()        Url_list = getUrl(hero_num)        pic_name_list = PicName(hero_id, path)        print('正在下载图片,请稍等。。。')        print('在' + path + '下查看...')        DownloadPic(pic_name_list, Url_list)        print('图片下载完毕')

好了,到这里我们已经完成了LOL全皮肤的获取,接下来进行最有意思的一步,千图成像!

千图成像
初级阶段我们先使用一款国外的合成软件。

软件下载地址:

https://fmedda.com/en/download

如果打不开,那就搜索“foto-mosaik-edda”下载即可!

7fc675db707d27d336e520e1b0c2278d.png

打开后界面是这样的。

ed34dac9b62441315e3b2c0805938436.png

先选第一步

4fac6fc6611108e858ddba04891b3683.png

72dbfdd54a75c8d5e4a80535f743d084.png

400fb29ea8ef23b8d938f4a9bbdf7349.png

再选第二步create photo mosaic

068bf487fca13d2aa676604cc094e860.png

0f30194dfb33602ded0374dca1f8a1c4.png

9ab6bf80db691b7d1b01fc124fbda19d.png

0875c434bf48a5906b65bb49720e7974.png

b9b10ad8ec9521029750c07f51ef9a75.png

效果图:

b47494164a83f1b5229a0558fc293218.png

局部:

982a5c65bee14be8b3e6c220547e2ab0.png

如果想直接尝试一下千图成像的,可到百度网盘下载我爬取到的皮肤图集:https://pan.baidu.com/s/19PywbOV1dBwr7r7bzsMhmw 密码:5arb

- END -

原文链接:

https://www.jianshu.com/p/c963370cd8df

文源网络,仅供学习之用。如有侵权,联系删除。

往期精彩

74119bcd674b2b6f493a191f2279c3a6.png

◆  50款开源工具你都用过吗?

◆  python+C、C++混合编程的应用

◆  python网络爬虫的基本原理详解

◆  Python自动操控excel,一小时解决你一天的工作

◆  如何用Python增强Excel,减少处理复杂数据的痛苦?

015d6646efeb12e8046a7402dd9568c7.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值