2020年04月_进击的路飞桑

12月 11月 09月 08月 07月 06月 05月 04月 03月 02月 01月

转载 SSD网络中的L2标准化

L1标准化：每个元素/L1范数 L2标准化：每个元素/L2范数SSD网络中的L2标准化VGG16的conv4_3特征图的大小为38*38，网络层靠前，方差比较大，需要加一个L2标准化，以保证和后面的检测层差异不是很大。L2标准化的公式如下：...

2020-04-30 09:41:36 1507 2

原创范数与正则化

范数比较1、2两个数字的大小，其结果显而易见。但我们如何比较（3,6）、（4,5）两个向量的大小呢？此时就用到了范数。范数是衡量某个向量空间（或矩阵）中的每个向量的长度或大小。范数的一般化定义：对实数p>=1，范数定义如下：L1范数当p=1时，是L1范数，其表示某个向量中所有元素绝对值的和。L2范数当p=2时，是L2范数，表示某个向量中所有元素平方和再开根...

2020-04-29 16:59:08 1536

转载双线性插值与三线性插值

双线性插值：原图像中4个像素点灰度值计算得到新图像中1个像素点灰度值。（双：两个维度进行计算）三线性插值：原图像中8个像素点灰度值计算得到新图像中1个像素点灰度值。（三：三个维度进行计算）双三次插值：原图像中16个像素点灰度值计算得到新图像中1个像素点灰度值。详情请查看此文章双线性插值已知Q11(x1,y1)、Q12(x1,y2)、Q21(x2,y1)、Q22(x2,y2)，求点P...

2020-04-20 17:04:17 2637 1

原创 sigmoid与softmax函数的区别

我们经常可以看到，在Unet等网络的输出后面通常加一个sigmoid或者softmax函数，这样做的原因是：网络的输出值通常处于一个我们无法预知的值域，这时我们可以使用sigmoid等函数将输出值映射到一个固定的值域，方便我们使用一个固定的阈值来判断该输出值是否属于目标类别。二分类函数sigmoid表达式如下：...

2020-04-19 17:31:24 598

转载空洞卷积

空洞卷积的意义空洞卷积（Dilated/Atrous Convolution）最初是为解决图像语义分割的问题而提出的。常见的图像分割算法通常使用池化层来增大感受野，同时也缩小了特征图尺寸，然后再利用上采样还原图像尺寸。特征图缩小再放大的过程造成了精度上的损失，因此需要有一种操作可以在增加感受野的同时保持特征图的尺寸不变，从而代替池化与上采样操作，在这种需求下，空洞卷积就诞生了。空洞卷积的定...

2020-04-17 21:39:37 1375

原创 Detectron 2的简介、安装与demo运行

简介Detectron 2是基于 PyTorch 框架的目标检测平台，源码地址。新模型Detectron2 包括原始 Detectron 中的所有模型，例如 Faster R-CNN，Mask R-CNN，RetinaNet 和 DensePose。除此之外，Detectron2 还加入了几个新模型，包括：Cascade R-CNN，Panoptic FPN 和 TensorMask，未来...

2020-04-13 09:33:31 6543 5

原创 faster-rcnn源码中test_net.py文件的evaluate_detections函数

本文基于pytorch1.0实现的faster-rcnn源码进行讲解，点击获取源码。当faster-rcnn训练完成后，我们需要对训练结果的检测能力进行评估，此时用到了evaluate_detections函数。其调用方式如下： print('Evaluating detections') imdb.evaluate_detections(all_boxes, output_dir...

2020-04-09 16:25:04 879

原创 VOC2007数据集

如上图所示，完整的VOC2007数据集有三个压缩包：VOCdevkit_08-Jun-2007.tar：开发工具包VOCtest_06-Nov-2007.tar：测试集，4952张图片VOCtrainval_06-Nov-2007.tar：训练和验证集，5011张图片其中test和trainval的数据集目录结构一样，同时解压三个压缩包，最终会自动解压到一个文件夹下VOCdec...

2020-04-08 09:25:47 1227

转载深度学习输入图像为何要减去均值

根据求导的链式法则，w的局部梯度是X，当X全为正时，由反向传播传下来的梯度乘以X后不会改变方向，要么为正数要么为负数，也就是说w权重的更新在一次更新迭代计算中要么同时减小，要么同时增大。...

2020-04-06 14:18:59 2679

原创批量规范化（Batch Normalization，BN）

数据标准化由于神经网络的表达能力大多来自激活函数的非线性，所以让输入数据“适应于”激活函数是很重要的，具体而言：对于sigmoid系列的激活函数而言，由于函数两端过于平坦，所以为了不陷入梯度消失的窘境，我们希望神经元的输入集中在函数中央，而不希望神经元的输入（绝对值）过大。对于Relu激活函数而言，由于函数在输入小于0的区域恒等于0，那么从直观上来说，如果一个很大的梯度把某个神经元的输...

2020-04-03 17:05:57 5257

转载激活函数

原文地址： https://blog.csdn.net/tyhj_sf/article/details/79932893激活函数的意义如果一个网络中每个神经元的输出只是所有输入的加权和，那么无论神经网络有多少层，这个网络就只是一个线性模型，无法形成一个复杂的表达空间（与没有隐藏层效果相当，这种情况就是最原始的感知机）。为了提升网络的表达能力，我们需要加入非线性映射，即：激活函数。常...

2020-04-03 09:38:55 381

转载 Pytorch保存与加载模型

Pytorch中的torchvision包又包括3个子包，分别如下：torchvison.datasets：预定义好的数据集（比如MNIST、CIFAR10等）torchvision.models ：预定义好的经典网络结构（比如AlexNet、VGG、ResNet等）torchvision.transforms ：预定义好的数据增强方法（比如Resize、ToTensor等）mod...

2020-04-02 09:47:59 723 1

原创 pytorch中使用tensorboardX

我的环境配置：Ubantu18.04+python3.6.10+pytorch1.0.0+tensorboardX2.0+tensorflow2.1.0。以faster-rcnn源码中的使用方法为例进行说明：保存数据导入模块并创建一个SummaryWriter实例，使用此实例将训练信息保存在logs文件夹下 from tensorboardX import SummaryWri...

2020-04-01 16:50:02 1828

Cmake构建Opencv4.2需要下载的文件.zip

使用cmake编译opencv时，通常需要下载一些文件。由于网络原因，很可能会下载失败。我将这些文件上传，希望能帮助到大家

2020-05-31

vcxsrv-64.1.20.6.0.installer.exe

win10系统下安装ubantu子系统，安装X-Windows桌面环境使ubantu系统桌面化。此安装包在国外的服务器上，正常下载会很慢。

2020-02-01

图象处理中多边形拟合的快速算法_张帆.pdf

《图象处理中多边形拟合的快速算法》论文。本人利用C++实现了论文中描述的多边形拟合方法。整理了相关代码并发布博客，这里上传论文，供大家参考！

2019-07-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人