深度学习知识点
文章平均质量分 72
深度学习知识点
无码不欢的我
这个作者很懒,什么都没留下…
展开
-
torchsummary和torchstat使用方法和结果分析
1 torchstat:查看模型的大小和浮动运算量安装工具 pip install torchstat使用例子import torchimport torch.nn as nnfrom torchstat import statclass Net(nn.Module): def __init__(self): super(Net, self).__init__() self.layer1 = nn.Sequential( nn原创 2022-05-09 18:29:32 · 12807 阅读 · 6 评论 -
感受野的含义及计算方法
1 感受野(Receptive Field)的概念感受野(Receptive Field)的概念:在卷积神经网络中,感受野的定义是 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始输入图像上映射的区域大小。第一层卷积层的输出特征图像素的感受野大小等于卷积核大小,其它卷积层的输出特征图的感受野的大小和它之前所有层的卷积核大小和步长有关系2 感受野的作用:特征图上的感受野越大,那么该特征图上每一个特征点所能看到的原始输入图形上的区域就越大,所以该它越能检测比较大的物体,但是也越容原创 2022-02-15 00:48:47 · 12946 阅读 · 0 评论 -
Canny边缘检测
Canny边缘检测算法是由4步构成,分别介绍如下: 第一步:噪声去除 由于噪声会影响边缘检测的准确性 ,所以首先使用高斯滤波器去除噪声,在图像平滑那一章节中已经介绍过。 第二步:计算图像梯度 对平滑后的图像使用 Sobel 算子计算水平方向和竖直方向的一阶导数(Gx 和 Gy)。根据得到的这两幅梯度图(Gx 和 Gy)找到边界的梯度和方向,公式如下:...原创 2021-06-03 21:12:13 · 1667 阅读 · 0 评论 -
NMS(非极大值抑制)
非极大值抑制(Non-Maximum Suppression,NMS),顾名思义就是抑制不是极大值的元素。例如在行人检测中,滑动窗口经特征提取,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要用到NMS来选取那些邻域里分数最高(是行人的概率最大),并且抑制那些分数低的窗口。 NMS在计算机视觉领域有着非常重要的应用,如视频目标跟踪、数据挖掘、3D重建、目标识别以及纹理分析等 。在目标检测中,NMS的目的就是要去除冗余的检测框,保留原创 2021-05-31 23:39:17 · 3780 阅读 · 4 评论 -
卷积基础知识总结
卷积层是卷积神经网络中的核心模块,**卷积层的目的是提取输入特征图的特征,**如下图所示,卷积核可以提取图像中的边缘信息。卷积也成为过滤器,即Filter。原创 2023-06-29 20:55:16 · 3574 阅读 · 0 评论 -
载入模型部分权重的方法
如果我们对模型进行微调,比如改变模型的最后一个全连接层输出节点个数,此时我们再载入原来模型的预训练权重,就会报错。因为模型的结构已经发生了变化,所以它所对应的权重(通常以字典中键值对的形式存储)存储结构也会发生变化,所以载入的过程中就会出现不匹配的情况。此时我们有两种解决方法,第一种方法就是只载入模型的部分权重,比如本例中就只载入除了最后一个全连接后的所有权重。第二种方法是先不改变模型,直接使用原来的模型载入原来的预训练权重,然后再改动这个模型的结构,比如改变模型的最后一个全连接层输出节点个数。下面我们分别原创 2022-04-24 23:33:21 · 2283 阅读 · 0 评论 -
深入剖析Focal loss损失函数
目标检测方法常常使用先验框提高预测性能,一张图像可能生成成千上万的先验框,但是其中只有很少一部分能匹配到目标(正样本),而没有匹配到目标的先验框占大多数。这种情况造成了One-Stage目标检测方法的正负样本不平衡。如下图所示,红色的先验框都没有匹配到目标,所以它们都属于负样本,只是图中间的黄色先验框匹配到目标,所以它们是正样本。显然,这里的正负样本严重失衡。而对于two stage模型,比如Faster R-CNN这种two stage模型,第一阶段的RPN可以过滤掉很大一部分负样本,最终第二阶段的原创 2022-04-19 12:53:39 · 14981 阅读 · 14 评论