目标识别代码解读整理

最新推荐文章于 2020-12-05 13:56:49 发布

独鹿

最新推荐文章于 2020-12-05 13:56:49 发布

阅读量1.7k

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lijjianqing/article/details/80233776

版权

深度学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

end_points用来记录每一层的特征图，各层的特征图大小是不一样的

end_points[end_point] = net

特征层数记录

for i, layer in enumerate(feat_layers):

i表示第几个特征层，layer表示特征层的名字

把各层的特征图数据取出来end_points[layer]

把所有目标类别取出来num_classes

anchor的尺寸列表，有6个尺寸（莫非一个特征图上只用一个尺寸的anchor？）

anchor_sizes=[(21.,45.),(45., 99.), (99., 153.), (153., 207.), (207., 261.), (261., 315.)],

一个anchor尺寸上的不同比例列表anchor_ratios，不同层的比例个数不一样。

anchor_ratios=[[2,.5], [2, .5, 3, 1./3], [2, .5, 3, 1./3], [2, .5, 3, 1./3], [2, .5], [2, .5]],

各层上像素的放缩到的值，总共6层，

anchor_steps=[8,16, 32, 64, 100, 300]

取anchor 回归时需要用的调整数anchor_offset

normalizations是什么鬼还不清楚

normalizations=[20, -1, -1, -1, -1, -1],

一层特征图上的多框预测：（也就是在一层图上想要返回一个预测结果和位置的时候需要准备什么，准备好怎么处理）

需要准备的东西：这一层的特征图，这层图上框的尺寸，这个尺寸对应的几个比例，和一个不知道是什么鬼的normalization.

p, l = ssd_multibox_layer(end_points[layer],

num_classes,

anchor_sizes[i],

anchor_ratios[i],

normalizations[i])

准备好后怎么处理：

第一步：先看normalization是不是大于0，大于0的就把这一层的特征数据给正则化一下，不大于0的就不正则化了。（看normalizations的所有值，发现应该是只有在第一个特征图的那一层做了正则化，后面几个都没有做。）

if normalization > 0:

net =custom_layers.l2_normalization(net, scaling=True)

第二步：算一下这一特征图上的anchor个数，因为在传的时候anchor_size只传进来一个尺寸，所以这里的len(sizes)应该等于1，而传进来的anchor对应的不同比例len(rations)就是自定义的其他的几个比例个数，所以anchor个数就是等于1+其他定义好的比例个数。代码里这样写的：

num_anchors= len(sizes) + len(ratios)

第三步：框有了后进行确定框所在的位置，如何确定呢？利用和真实标记的anchor做回归来确定。

因为有多个anchor,而每个anchor要回归出4个值来确定位置。所以总共需要回归出值的个数有num_anchors*4个。

回归的过程：需要准备的东西有，这层特征图的值，要回归出的值的个数，再来一个3*3的卷积核，准备完回归用的东西后，通过卷积操作来完成回归。卷积操作后输入出的东西应该是一个通道个数为回归值个数的特征图。代码如下：

loc_pred= slim.conv2d(net, num_loc_pred, [3, 3], activation_fn=None,

scope='conv_loc')

（代码中还给了一个这样的操作，把通道数放到最后，但由于tensorflow默认的就是通道数在最后放的，所以这个代码感觉有点多余loc_pred = custom_layers.channel_to_last(loc_pred)）

回归结束后，把得到的特征图进行了重新塑形reshape，（塑形后的数据是一个列表，列表的长度为anchor的个数，列表里的具体每一项又是一个列表，这个列表是一个4个长度的list,即这4个值是一个anchor的四个位置信息）

、、、-------------------------------------------------精华代码啊-------------------------------

deftensor_shape(x, rank=3):

"""Returns the dimensions ofa tensor.

Args:

image: A N-D Tensor of shape.

Returns:

A list of dimensions. Dimensions that arestatically known are python

integers,otherwise they are integerscalar tensors.

"""

if x.get_shape().is_fully_defined():

return x.get_shape().as_list()

else:

static_shape =x.get_shape().with_rank(rank).as_list()

dynamic_shape = tf.unstack(tf.shape(x),rank)

return [s if s is not None else d

for s, d in zip(static_shape,dynamic_shape)]

‘’‘’‘’---------------------------------------------------------------------------------

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

独鹿 CSDN认证博客专家 CSDN认证企业博客

码龄12年

324: 原创

3万+: 周排名

7761: 总排名

35万+: 访问

: 等级

6358: 积分

105: 粉丝

147: 获赞

89: 评论

280: 收藏

私信

关注

热门文章

分类专栏

123 1篇
java 20篇
人工智能 6篇
操作系统 19篇
编程算法 51篇
机器学习 14篇
linux 19篇
caffe 5篇
python 76篇
c/c++ 1篇
tensorflow 8篇
深度学习 19篇
leetcode 165篇
数据结构 23篇
机器视觉 10篇
数据库 6篇
链表 18篇
二叉树 22篇
list 16篇
ARRAY 25篇
搜索树 1篇
图像处理 5篇
矩阵遍历 2篇
算法 21篇
剑指offer 9篇
GPU 2篇

最新评论

工业异常检测AnomalyGPT-训练试跑及问题解决
xiaopy_: 博主我看你的是从000.png开始跑请问为什么我的一直是137.png，请问您知道是是什么原因吗？
工业异常检测AnomalyGPT-Demo试跑
PF946: 有人复现test_visa.py了吗
FundationPose4090
南柏良客: 如何跑自己的视频数据呀？这里面有如何获取mesh的代码吗？
工业异常检测AnomalyGPT-训练试跑及问题解决
我是无敌干饭王: pydantic.error_wrappers.ValidationError: 1 validation error for DeepSpeedZeroConfig offload_optimizer -> device value is not a valid enumeration member; permitted: 'none', 'cpu', 'nvme' (type=type_error.enum; enum_values=[<OffloadDeviceEnum.none: 'none'>, <OffloadDeviceEnum.cpu: 'cpu'>, <OffloadDeviceEnum.nvme: 'nvme'>]) 这是deepspeed问题么
工业异常检测AnomalyGPT-Demo试跑
我是无敌干饭王: 运行web_demo提交图片就显示error，报错显示为RuntimeError: probability tensor contains either `inf`, `nan` or element < 0

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。