TF学习之DeepLabv3+代码阅读1(train)

最新推荐文章于 2024-08-09 19:20:42 发布

lscelory

最新推荐文章于 2024-08-09 19:20:42 发布

阅读量1.2k

点赞数

分类专栏：代码分析 TensorFlow 文章标签： TensorFlow DeepLab Python

本文链接：https://blog.csdn.net/lscelory/article/details/97787373

版权

本文详细解读了使用TensorFlow进行DeepLabv3+模型训练的代码，包括main()函数、_train_deeplab_model()损失计算、_tower_loss模块、_build_deeplab模型构建、_log_summaries日志总结以及_Average_gradients梯度平均等关键步骤。

摘要由CSDN通过智能技术生成

DeepLabv3+代码阅读之train.py

一、main()

def main(unused_argv):# main必须带参数，否则报错：'TypeError: main() takes no arguments (1 given)'; 
                      # main的参数名随意定义，无要求。
  tf.logging.set_verbosity(tf.logging.INFO) # 把日志设置在INFO级别
  tf.gfile.MakeDirs(FLAGS.train_logdir)
  tf.logging.info('Training on %s set', FLAGS.train_split)

  graph = tf.Graph()# tf.Graph()表示实例化了一个类，一个用于tf计算和表示用的数据流图，就是呈现计算图（节点和线，操作和数据）
  					# 的“纸”
  with graph.as_default():# 表示将这个类实例（graph，新生成的图）作为整个tf运行环境的默认图
  						  # 同时tf里面也已经存好的一张默认图，通过tf.get_default_graph()来调用（显示这张默认纸）
    with tf.device(tf.train.replica_device_setter(ps_tasks=FLAGS.num_ps_tasks)):# FLAGS.num_ps_tasks=0
      assert FLAGS.train_batch_size % FLAGS.num_clones == 0, (
          'Training batch size not divisble by number of clones (GPUs).')
      clone_batch_size = FLAGS.train_batch_size // FLAGS.num_clones

      dataset = data_generator.Dataset(
          dataset_name=FLAGS.dataset,# pascal_voc_seg
          split_name=FLAGS.train_split,# train
          dataset_dir=FLAGS.dataset_dir,
          batch_size=clone_batch_size,
          crop_size=[int(sz) for sz in FLAGS.train_crop_size],# FLAGS.train_crop_size = ['513', '513']
          													  # crop_size = [513, 513]
          min_resize_value=FLAGS.min_resize_value,
          max_resize_value=FLAGS.max_resize_value,
          resize_factor=FLAGS.resize_factor,
          min_scale_factor=FLAGS.min_scale_factor,
          max_scale_factor=FLAGS.max_scale_factor,
          scale_factor_step_size=FLAGS.scale_factor_step_size,
          model_variant=FLAGS.model_variant,
          num_readers=2,
          is_training=True,
          should_shuffle=True,
          should_repeat=True)

      train_tensor, summary_op = _train_deeplab_model(
          dataset.get_one_shot_iterator(), dataset.num_of_classes,
          dataset.ignore_label)

      # Soft placement allows placing on CPU ops without GPU implementation.
      session_config = tf.ConfigProto(
          allow_soft_placement=True, log_device_placement=False)

      last_layers = model.get_extra_layer_scopes(
          FLAGS.last_layers_contain_logits_only)
      init_fn = None
      if FLAGS.tf_initial_checkpoint:
        init_fn = train_utils.get_model_init_fn(
            FLAGS.train_logdir,
            FLAGS.tf_initial_checkpoint,
            FLAGS.initialize_last_layer,
            last_layers,
            ignore_missing_vars=True)

      scaffold = tf.train.Scaffold(
          init_fn=init_fn,
          summary_op=summary_op,
      )

      stop_hook = tf.train.Sto