学习笔记之——基于tensorflow的VESPCN

最新推荐文章于 2024-06-08 11:45:00 发布

gwpscut

最新推荐文章于 2024-06-08 11:45:00 发布

阅读量2.9k

点赞数

本文链接：https://blog.csdn.net/gwplovekimi/article/details/84304668

版权

图像超分辨率重建同时被 2 个专栏收录

75 篇文章 39 订阅

订阅专栏

TensorFlow

2 篇文章 1 订阅

订阅专栏

之前已经写了挺多的博文关于image 超分了，接下来研究一下video 超分。之前博文已经对VESPCN进行了理论的介绍（《学习笔记之——基于深度学习的图像超分辨率重构》）

之前做的超分都是基于pytorch的，这次这个项目是tensorflow的。。。。然后一开始学习超分的代码是cafe的。。。。。。?本博文先对基于tensorflow的VESPCN做深入的剖析，然后再移植到之前的代码库中，用pytorch实现。

本博文主要参考代码：https://github.com/zhxl0903/CSCD94_VESPCN

数据集放于文件train中，测试集放于test文档中。

注释并作一定修改的代码如下（部分注释与修改来自课题组的师弟哈~）：

main.py

import tensorflow as tf
from model import ESPCN
import os
os.environ["CUDA_VISIBLE_DEVICES"] = '5'

"""
    执行main函数之前首先进行flags的解析，
    也就是说TensorFlow通过设置flags来传递the required parameters to the tf.app.run()in the main.py
    也就是超参数的人为设置，然后存放在 FLAGS 中
    参数如下：
"""
flags = tf.app.flags
FLAGS = flags.FLAGS

"""
       参数名称           默认值             描述
    1.  epoch             1200             1个epoch表示过了1遍训练集中的所有样本，这里表示一共训练1200次
    2.  image_size        32               读入图片的尺寸(不是原图尺寸，而是网络入口要求的图片尺寸(数据子图)，见详解
    3.  c_dim             3                图片通道数，一般RGB因此为3
    4.  train_mode        0                作者在此项目中实现了不同的网络训练模型，此参数是各模型代号（0~6）
    5.  scale             3                用于预处理输入图像的尺度因子的大小，即缩小比例
    6.  stride            100              步长，用于裁剪原图生成数据子图，见详解
    7.  checkpoint_dir    checkpoint       文件名，用于（暂时）存放训练所得模型参数
    8.  learning_rate     0.0001           学习速度
    9.  batch_size        128              1次迭代所使用的样本量，即一次抓取多少图片(不是原图，是裁剪过后的数据子图)
    10. result_dir        result           文件名，用于存放结果【不很重要】
    11. test_img          ‘ ’              【不清楚】
    12. load_existing_data False           判断hf数据是否被加载【暂不明白】
"""
#         第一个是参数名称，   第二个参数是默认值，   第三个是参数描述
flags.DEFINE_integer("epoch",          1200,           "Number of epoch")
flags.DEFINE_integer("image_size",     32,             "The size of image input")
flags.DEFINE_integer("c_dim",          3,              "The size of channel")
flags.DEFINE_boolean("is_train",       True,          "if training")
flags.DEFINE_integer("train_mode",     2,
                     "0: Spatial Transformer       1: 9-L Single-Frame ESPCN    2: 9L-E3-MC VESPCN \
                      3: Bicubic(No Training Required)          4: SRCNN \
                      5: Multi-Dir mode for testing mode 2       6: Multi-Dir mode for testing mode 1 \
                      7: FSRCNN ")
flags.DEFINE_integer("scale",          3,              "the size of scale factor for preprocessing input image")
flags.DEFINE_integer("stride",         100,            "the size of stride")
flags.DEFINE_string("checkpoint_dir",  "checkpoint",   "Name of checkpoint directory")
flags.DEFINE_float("learning_rate",    1e-5 ,          "The learning rate")
flags.DEFINE_integer("batch_size",     128,            "the size of batch")
flags.DEFINE_string("result_dir",      "result",       "Name of result directory")
flags.DEFINE_string("test_img",        "",             "test_img")
flags.DEFINE_boolean("load_existing_data",    False,
                     "True iff existing hf data is loaded for training/testing")


def main(_):

    """
    设置配置并启用GPU内存分配增长，tf.ConfigProto()用以配置Session运行参数
    当其参数allow_growth设置为True时，分配器将不会指定所有的GPU内存，而是动态申请显存
    """
    config = tf.ConfigProto()
    config.gpu_options.allow_growth = True
    
    # 检查训练模式是否为3、5或6，is_train是否开启
    # 因为mode3\mode5\mode6是不用训练的，若在这些模式下要求训练，则直接退出
    if FLAGS.train_mode == 3 and FLAGS.is_train:
        print('Error: Bicubic Mode does not require training')
        return
    elif FLAGS.train_mode == 5 and FLAGS.is_train:
        print('Error: Multi-Dir testing mode for Mode 2 does not require training')
        return
    elif FLAGS.train_mode == 6 and FLAGS.is_train:
        print('Error: Multi-Dir testing mode for Mode 1 does not require training')
        return

    """ 
        接下来执行会话，初始化ESPCN对象，开始训练或测试" \
        ESPCN对象：
            1. 基于OOP思想，本项目绝大多数与神经网络有关的超参数、操作都被封装于一个ESPCN类的对象中
            2. ESPCN对象被创建后，会自动依据传入的超参数，进行对应mode的网络的构建
            3. 随后执行train()函数，进行训练/测试 + 保存结果等一系列操作(函数名虽然是train，也可以用于测试)
    """
   # 给Session配置运行参数
    with tf.Session(config=config) as sess:
        # 使用传递进来的人工设定的参数初始化ESPCN对象
        espcn = ESPCN(sess,  #会话信息
                      image_size=FLAGS.image_size,  # 图片尺寸
                      is_train=FLAGS.is_train,      # 是否训练模式
                      train_mode=FLAGS.train_mode,  # 何种训练模式
                      scale=FLAGS.scale,            # 尺度
                      c_dim=FLAGS.c_dim,            # 图片通道数
                      batch_size=FLAGS.batch_size,  # 单次抓取数据量
                      load_existing_data=FLAGS.load_existing_data, # 数据是否读入
                      config=config                 # 会话参数
                      )
        # 开始训练，将所需各参数传递进去

        espcn.train(FLAGS)


if __name__ == '__main__':
    
    # 解析命令行参数;然后调用主函数
    tf.app.run()

model.py

训练时要保证

flags.DEFINE_boolean("is_train",       True,          "if training")

训练的模式

("train_mode", 0, "0: Spatial Transformer 1: 9-L Single-Frame ESPCN\
                     2: 9L-E3-MC VESPCN 3: Bicubic (No Training Required) 4: SRCNN \
                     5: Multi-Dir mode for testing mode 2 6: Multi-Dir mode \
                     for testing mode 1")

补充

关于tf.app.run()

if __name__ == '__main__':
    tf.app.run()

处理flag解析，然后执行main函数，而flag解析就是输入的参数

https://blog.csdn.net/helei001/article/details/51859423

关于VESPCN参考https://blog.csdn.net/Cyiano/article/details/78368263?locationNum=4&fps=1

gwpscut

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
3
评论
学习笔记之——基于tensorflow的VESPCN

之前已经写了挺多的博文关于image 超分了，接下来研究一下video 超分。之前博文已经对VESPCN进行了理论的介绍（《学习笔记之——基于深度学习的图像超分辨率重构》）之前做的超分都是基于pytorch的，这次这个项目是tensorflow的。。。。然后一开始学习超分的代码是cafe的。。。。。。
复制链接

扫一扫

专栏目录