使用的图片数据
我本想使用ImageNet做为图片来源,就像论文中使用的。ImageNet图像有现成的分类,抓取也容易,但是由于很多源都被防火墙屏蔽,下载速度堪忧。
我看到网上有很多爬妹纸图的Python脚本,额,我爬了几天几夜的妹纸图(特别暴露那种),额,我就想看看PixelCNN最后能生成什么鬼。
如果你懒的爬图片,可以使用我抓取的图片(分成两部分):
- https://pan.baidu.com/s/1kVSA8z9 (密码: atqm)
- https://pan.baidu.com/s/1ctbd9O (密码: kubu)
数据预处理
下载的图片分布在多个目录,把图片汇总到一个新目录:
import os
old_dir = 'images'
new_dir = 'girls'
if not os.path.exists(new_dir):
os.makedirs(new_dir)
count = 0
for (dirpath, dirnames, filenames) in os.walk(old_dir):
for filename in filenames:
if filename.endswith('.jpg'):
new_filename = str(count) + '.jpg'
os.rename(os.sep.join([dirpath, filename]), os.sep.join([new_dir,