Ai随笔

zjjszj

于 2020-04-08 20:29:10 发布

阅读量166

点赞数

分类专栏：随笔

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZJpingfanzhilu/article/details/105396220

版权

随笔专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1、ResNet50结构

在这里插入图片描述

2 residual block

在这里插入图片描述
一般将输入 $a^i$ 放到两层卷积之后，并且在relu之前。resnet50某一个残差块如下图：

$z^{i+1}=w^{i+1}*a^i+b^{i+1}$
$a^{i+1}=r(z^{i+1})$
$a^{i+2}=r(z^{i+2}+a^i)$
$r(w^{i+2}a^{i+1}+b^{i+2}+a^i)$
如果 $w^{i+2}=0$ , $b^{i+2}=0$ ， $r ()$ 为relu激活函数，那么 $a^{i+2}=a^i$ ，因此当网络比较深时，信息依然能传过来，至少不损害精度，经过训练后甚至可以提高精度。

在实现时需要注意的是：

若 $z^{i+2}$ 与 $a^i$ 的维度不同，那么可以 $w_s$ 转化为相同的维度，或是将少的维度补0.

3. 浅层包含更多的细节特征，深层包含更多的语义特征。

4. roi pooling和roi align

roi pooling

缺点：有两处量化处理：1. 将原图roi坐标映射到feature map中的坐标，可能会有小数。2. 每个bin的大小，可能会有小数。
roi pooling每个bin的大小计算方法之一为：
假设roi大小为10x10，roi之后的大小为3x3， $\lfloor 10/3 \rfloor=3$ ，所以3x2+4=10,前两个bin的大小为3，最后一个为4.
过程如下图所示。

roi align
不需要以上两个量化处理。过程如下图所示，假设每个bin包含4个采样点。

图像平移与旋转

设图像某像素变换前坐标为 $x_0,y_0)$ ，变换后的作标为 $(x, y)$ 。
1 平移
x轴方向上平移 $t_x$ ，y轴方向上平移 $t_y$ ，则：
$x=x_0+t_x$
$y=y_0+t_y$
使用矩阵表示：
$$
2 旋转
设逆旋转角度为 $\theta$ ，将 $x_0,y_0)$ 用极坐标表示为：
$x_0=rcos\alpha$
$y_0=rsin\alpha$
旋转后：
$x=rcos(\alpha+\theta)=x_0cos\theta-y_0sin\theta$
$y=rsin(\alpha+\theta)=x_0sin\theta-y_0cos\theta$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Ai随笔

1、ResNet50结构
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。