【目标检测三】TensorFlow版本Faster R-CNN特征图可视化

最新推荐文章于 2024-01-16 17:15:18 发布

置顶

南石北岸生

最新推荐文章于 2024-01-16 17:15:18 发布

阅读量7.8k

点赞数 5

分类专栏： Faster R-CNN 目标检测 tensorflow

本文链接：https://blog.csdn.net/gusui7202/article/details/86491698

版权

参考文献：

https://blog.csdn.net/zd_nupt/article/details/77508083

endernewton 的 Tensorflow 版 Faster RCNN 代码:

https://github.com/endernewton/tf-faster-rcnn

网上一般使用tensorboard，但是slim封装没有保存中间操作，无法用，只能自己提取block的特征可视化。

具体代码：

 在下面

我用的resnetv1_101，也就是slim封装好的模型。下面可视化RPN输入的特征图。

单张显示：（看出来已经对目标有感应了。）

集体显示：

说得具体一点：

在faster-master-lib文件夹下，有生成网络的network类代码network.py主要修改这里面。在RPN生成的时候，把输入的特征数据保存下来，然后再test-image的时候，加入上面的绘图程序就可以了，如要要其他地方的特征就需要想办法把其他位置的特征数据保存下来，然后绘图。

具体修改后的Network代码是这样的。

# --------------------------------------------------------
# Tensorflow Faster R-CNN
# Licensed under The MIT License [see LICENSE for details]
# Written by Xinlei Chen
# --------------------------------------------------------
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import tensorflow as tf
import tensorflow.contrib.slim as slim
from tensorflow.contrib.slim import losses
from tensorflow.contrib.slim import arg_scope

import numpy as np

from layer_utils.snippets import generate_anchors_pre, generate_anchors_pre_tf
from layer_utils.proposal_layer import proposal_layer, proposal_layer_tf
from layer_utils.proposal_top_layer import proposal_top_layer, proposal_top_layer_tf
from layer_utils.anchor_target_layer import anchor_target_layer
from layer_utils.proposal_target_layer import proposal_target_layer
from utils.visualization import draw_bounding_boxes

from model.config import cfg
from tensorflow.python.ops import variable_scope
import matplotlib.pyplot as plt

class Network(object):
  def __init__(self):
    self._predictions = {}
    self._losses = {}
    self._anchor_targets = {}
    self._proposal_targets = {}
    self._layers = {}
    self._gt_image = None
    self._act_summaries = []
    self._score_summaries = {}
    self._train_summaries = []
    self._event_summaries = {}
    self._variables_to_fix = {}
    self._bb = {}#添加这个

  def _add_gt_image(self):
    # add back mean
    image = self._image + cfg.PIXEL_MEANS
    # BGR to RGB (opencv uses BGR)
    resized = tf.image.resize_bilinear(image, tf.to_int32(self._im_info[:2] / self._im_info[2]))
    self._gt_image = tf.reverse(resized, axis=[-1])

  def _add_gt_image_summary(self):
    # use a customized visualization function to visualize the boxes
    if self._gt_image is None:
      self._add_gt_image()
    image = tf.py_func(draw_bounding_boxes, 
                      [self._gt_image, self._gt_boxes, self._im_info],
                      tf.float32, name="gt_boxes")
    
    return tf.summary.image('GROUND_TRUTH', image)

  def _add_act_summary(self, tensor):
    tf.summary.histogram('ACT/' + tensor.op.name + '/activations', tensor)
    tf.summary.scalar('ACT/' + tensor.op.name + '/zero_fraction',
                      tf.nn.zero_fraction(tensor))

  def _add_score_summary(self, key, tensor):
    tf.summary.histogram('SCORE/' + tensor.op.name + '/' + key + '/scores', tensor)

  def _add_train_summary(self, var):
    tf.summary.histogram('TRAIN/' + var.op.name, var)

  def _reshape_layer(self, bottom, num_dim, name):
    input_shape = tf.shape(bottom)
    with tf.variable_scope(name) as scope:
      # change the channel to the caffe format
      to_caffe = tf.transpose(bottom, [0, 3, 1, 2])
      # then force it to have channel 2
      reshaped = tf.reshape(to_caffe,
                            tf.concat(axis=0, values=[[1, num_dim, -1], [input_shape[2]]]))
      # then swap the channel back
      to_tf = tf.transpose(reshaped, [0, 2, 3, 1])
      return to_tf

  def _softmax_layer(self, bottom, name):
    if name.startswith('rpn_cls_prob_reshape'):
      input_shape = tf.shape(bottom)
      bottom_reshaped = tf.reshape(bottom, [-1, input_shape[-1]])
      reshaped_score = tf.nn.softmax(bottom_reshaped, name=name)
      return tf.reshape(reshaped_score, input_shape)
    return tf.nn.softmax(bottom, name=name)

  def _proposal_top_layer(self, rpn_cls_prob, rpn_bbox_pred, name):
    with tf.variable_scope(name) as scope:
      if cfg.USE_E2E_TF:
        rois, rpn_scores = proposal_top_layer_tf(
          rpn_cls_prob,
          rpn_bbox_pred,
          self._im_info,
          self._feat_stride,
          self._anchors,
          self._num_anchors
        )
      else:
        rois, rpn_scores = tf.py_func(proposal_top_layer,
                              [rpn_cls_prob, rpn_bbox_pred, self._im_info,
                               self._feat_stride, self._anchors, self._num_anchors],
                              [tf.float32, tf.float3

最低0.47元/天解锁文章

南石北岸生

关注

5
点赞
踩
39

收藏

觉得还不错? 一键收藏
28
评论
【目标检测三】TensorFlow版本Faster R-CNN特征图可视化

参考文献：https://blog.csdn.net/zd_nupt/article/details/77508083endernewton的 Tensorflow 版 Faster RCNN 代码:https://github.com/endernewton/tf-faster-rcnn网上一般使用tensorboard，但是slim封装没有保存中间操作，无法用，只能自己提取b...
复制链接

扫一扫