02-特征逆推图像实验

该博客介绍了特征逆推图像的实验,包括VGGNET的py实现、HOG和SIFT特征、残差网络的学习及其原理。实验关注学习率、Total-Variation正则化的影响,以及不同深度网络的特征提取效果。
摘要由CSDN通过智能技术生成

特征逆推图像

github: https://github.com/Gary11111/02-Inversion

研究背景

ONNX

很多优秀的视觉模型都是用caffe写的, 很多新的研究论文使用Pytorch写得,而更多的模型用TF写成,因此如果我们要测试它们就需要对应的框架环境,ONNX交换格式时我们能够在同一环境下进行不同模型的测试。

VGGNET结构py实现

13个卷积层 + 3个全连接层

卷积层
  • conv2d+bias
  • batchnorm正则化
  • relu激活
def conv_layer(self, bottom, name, stride = 1):
    with tf.variable_scope(name):
        filt = self.get_conv_filter(name)
        conv = tf.nn.conv2d(bottom, filt, [1, stride, stride, 1], padding='SAME')
        conv_biases = self.get_bias(name)
        bias = tf.nn.bias_add(conv, conv_biases)
        mean = self.get_mean(name)
        variance = self.get_variance(name)
        offset = self.get_beta(name)
        scale = self.get_gamma(name)
        norm = tf.nn.batch_normalization(bias, mean, variance, offset, scale, 1e-20 )
        relu = tf.nn.relu(norm)
        return relu
HOG 方向梯度直方图

HOG+SVM是行人检测的主要方法

  1. 主要思想:在一副图像中,局部目标的表象和形状能够被梯度或边缘方向密度分布很好描述(梯度的统计信息主要集中在边缘部分)
  2. 具体实现方法:把图像分成很小的联通区域,称为细胞单元,然后采集细胞单元中各像素点的梯度或者边缘方向的直方图,然后把直方图组合起来构成特征描述器。
  3. 优点:
    1. HOG在图像的局部单元上进行操作,所以对图像的几何和光学形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。
    2. 在粗的空域抽象、精细方向抽样以及较强的局部光学归一化等条件下,只要行人大题能够保持直立姿势,可以忽略一些细微动作带来的影响。
SIFT 尺度不变特征转化

用来侦测与描述影像中的局部特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量。

应用范围:物体辨识、机器人地图感知与导航、影像追踪、手势辨识等。

局部影像特征帮助辨识物体:

  1. SIFT特征是基于物体上的一些局部外观特征兴趣点而与影像大小和旋转无关,对于光线、噪声、些微视角改变的容忍度页相当高。基于这个特性,高度显著且容易撷取,在庞大的特征数据库中,很容易辨识物体且鲜有误认。
  2. 使用SIFT描述特征对部分物体遮蔽的侦测率页相当高,甚至只需要三个以上的SIFT物体特征就足以计算出位置与方位。辨识速度可以接近即时运算。
作业的思路

VGGNET16已经准备好(参数已经训练好了)。

  1. 使用原图构建一个VGG16计算图 — bottom
  2. 使用noise构建一个VGG16计算图
  3. 指定计算图的某一层,比如conv3_1, 目的就是看在这一层神经网络学到了什么内容。
  4. bottom在构建的时候只初始化一次,不会更新,作为noise学习的target;使用欧几里得距离来计算误差【损失函数】
  5. 使用ADAM作为优化器,对损失函数进行优化。
记录TF优化器内置方法
  • compute_gradients(loss, val_list)

用来计算loss对val_list中每一项的偏导

  • a
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值