tensorflow python3编程_PixelCNN++实现：基于 Python3 和 TensorFlow

最新推荐文章于 2024-05-12 09:55:48 发布

宋梦寒

最新推荐文章于 2024-05-12 09:55:48 发布

阅读量206

点赞数

文章标签： tensorflow python3编程

本文链接：https://blog.csdn.net/weixin_42527178/article/details/113545170

版权

本文介绍了OpenAI在GitHub上公开的TensorFlow框架中使用Python3实现的PixelCNN++源码，该模型在ICLR 2017被接收。PixelCNN是一种强大的生成模型，适用于CIFAR-10等数据集，支持多GPU训练，并提供了预训练模型检查点。

摘要由CSDN通过智能技术生成

OpenAI 在 GitHub 公开了 TensorFlow 框架里用 Python3 实现的 PixelCNN 优化版——PixelCNN++的源码，其论文已被 ICLR 2017 接收。所公开的源码是 PixelCNN++的具体代码实现，是在 TensorFlow 框架里用 Python3 编写的。

PixelCNN 是一类强大的生成模型，它有易处理似然性(tractable likelihood)从而容易进行抽样。其核心的卷积神经网络计算在一个像素值上的概率分布，且受左侧和上侧的像素值约束。

设置

以下环境运行该代码:多 GPU 计算机

Python3

Numpy, TensorFlow

训练模型

使用 train.py 脚本进行模型的训练，在 CIFAR-10 上训练默认模型只需要简单键入：

python3 train.py

你可能希望至少可更改 --data_dir 和 --save_dir，它们指向系统下载数据的路径(如果是无效的)和保存点的位置。

我想使用更少的 GPU 进行训练。为了在更少的 GPU 上训练，我们建议使用 CUDA_VISIBLE_DEVICES 缩小 GPU 可用(the visibility of GPUs)数量，然后再运行脚本。不要忘记相应地调制 flag： --nr_gpu。

我想训练自己的数据集。看看 data/ 文件夹中的 DataLoader 类，必须为你自己的数据集写一个类似的数据迭代器，然后代码才能从那边正常运行。

预训练模型检查点(checkpoint)