深度学习
文章平均质量分 52
五-花~肉
头发少一根,实力多一分!
展开
-
关于膨胀卷积
膨胀卷积(空洞卷积)膨胀卷积和普通卷积区别普通卷积:膨胀卷积:增加感受野的几种方式使用更大卷积核通过池化层减小特征图尺寸,从而增大感受野增加网络深度膨胀卷积膨胀卷积优势在哪相比于更大尺寸的卷积核,膨胀卷积的运算量明显更少池化层会减小图像尺寸,从而丢失图像的部分细节,使用膨胀卷积则可以避免网络加深效率很低,要增加更多的网络层,增加很多计算量...原创 2022-03-16 09:25:27 · 501 阅读 · 0 评论 -
关于转置卷积
转置卷积首先:转置卷积不是卷积的逆运算,转置卷积也是卷积操作,不同的是进行转置卷积后图像尺寸变大而不是变小转置卷积主要用于将图像还原回原本的尺寸如何能做到卷积后图像反而变大?主要通过填充空白像素块来增大被卷积图像的尺寸,在尺寸增大后的新图像上做卷积操作,可以得到比被卷积图像更大的特征图。如图:空白像素填充方式由变量s,p,k控制在输入特征图元素间填充s-1行、列在输入特征图四周填充k-p-1行、列例如:转置卷积运算步骤填充空白像素将下采样所用卷积核上下、左右翻转原创 2022-03-15 18:03:14 · 539 阅读 · 0 评论 -
Self-Attention(笔记,自用)
Self-AttentionSelf-Attention本文为观看哔哩哔哩up主霹雳吧啦Wz深度学习教程记得笔记,图片为视频截图,自用,侵删。Wq,Wk,Wv所有ai共享q:query,用来match其他aik:key,用于被其他match匹配v:value,从ai当中提取得到的信息将所有ai连接成为一组向量A,则:Q = A*Wq,K = A*Wk,V = A*WvAttention公式Q*KT:用矩阵的计算方法计算全部所有每一组ai和aj的关联度上一步原创 2022-02-20 22:06:18 · 692 阅读 · 0 评论 -
上采样和下采样(笔记,自用)
上采样和下采样问题:图像分割为什么要采样?传统的方法是在原有的图像上直接进行处理,会保留很多图片的细节,为什么现在的方法要先下采样再上采样,是否多此一举?个人理解:如果像传统方法一样在原图像上对每个像素进行操作,那么会受到图像上面很多噪声的干扰,而下采样则是提取图片特征的手段,在下采样的过程中图片尺寸会越来越小,图片变成类似“热图”一样,这个过程中就将噪声过滤掉了,所以我们需要下采样。下采样过后我们需要输出一个和原本图片相同大小的图片,所以需要上采样才做来恢复图片尺寸。把抽象出来的特征图还原放大。另外原创 2022-02-20 17:34:34 · 3847 阅读 · 1 评论 -
卷积神经网络(笔记,自用)
卷积神经网络(笔记,自用)相对于普通全连接神经网络,卷积神经网络更擅长处理图像问题。主要原因在于全连接神经网络的输入是一个长条的一维向量,我们如果想将图片信息输入,就只能将二维的图像打成一维的长条再输入,这样不仅导致计算量很大,也忽略了图像中像素与像素之间的空间位置关联性。卷积神经网络支持输入二维图像信息,同时滑动窗口的卷积操作也可以很好地保留像素与像素之间的位置关系。卷积神经网络工作原理卷积层如图,设置3*3的卷积核,内部的9个值分别为1,0,1,0,1,0,1,0,1卷积核从左上角起始,原创 2022-02-19 16:13:39 · 1325 阅读 · 0 评论 -
神经网络基础(笔记,自用)
神经网络基础(笔记,自用)神经元结构n个输入X1 - Xn,分别*各自的权值W1 - Wn后,加和,再加上一个偏置b得到一个数(其实是线性计算)将这个数输入到一个激活函数中,输出一个结果,结果再传递到下一个神经元当中(是一个非线性计算)如上图所示,最终是X1 - Xn做一次线性运算 + 一次非线性运算,最终会得到一个非线性运算的效果。可以想象,如果将一组数据输入一个由成千上万个这样的神经元构成的神经网络,就相当于做很多很多次非线性运算,这些运算就可以近似组成一个非常非常复杂的函数(就跟泰勒展原创 2022-02-19 16:11:59 · 434 阅读 · 0 评论 -
YOLOv1(训练过程)
YOLOv1训练阶段YOLOv1在训练时,权重朝着什么方向更新呢?上篇文章提到每个grid cell能预测两个bounding box,那么,训练的目的其实是使标签中画出的标准框所属的grid cell,这个grid cell能预测出两个bounding box,我们选择一个和标准框IOU大的bounding box,使它朝着和标准框重合的方向更新梯度,另一个IOU小的bounding box我们使它的置信度尽量小,从而在预测时更容易被淘汰YOLOv1损失函数如下:坐标损失: 包含2项负责检原创 2021-08-20 00:29:24 · 1855 阅读 · 0 评论 -
YOLOv1(预测过程)
YOLOv1(预测过程)输入:448 * 448 * 3图像输出:7 * 7 * 30 张量具体步骤:输入:一、图向分为7 * 7网格,每个小格称为一个grid cell二、每个grid cell 能预测出如下:2个bounding box,即2个预测框,这B个预测框的中心点都落在生成这个预测框的grid cell里(所以每张图片会生成7 * 7 * 2 = 98个bounding box)对应每种类别的条件概率,即在这个grid cell生成的bounding box框住的是一个物体的前原创 2021-08-18 00:43:49 · 2709 阅读 · 3 评论 -
关于向量范数
关于向量范数1-范数:也就是向量各个元素的绝对值之和。2-范数:也就是向量各个元素的平方和再开方p-范数:上面两个范数的一般形式,也就是向量各个元素绝对值的p次方和 的1/p次幂∞ 范数:也就是向量各个元素绝对值的最大值-∞ 范数:也就是向量各个元素绝对值的最小值...原创 2021-05-22 20:51:28 · 446 阅读 · 0 评论 -
关于anaconda安装pycocotools出现error: Unable to find vcvarsall.bat错误的解决方法
关于anaconda安装pycocotools出现error: Unable to find vcvarsall.bat错误的解决方法这里我的VS版本是2017这里error: Unable to find vcvarsall.bat这行报错是在python环境下的\Lib\distutils中的_msvccompiler.py文件第120-130左右的一段代码输出的,如下:阅读代码之后发现原因是根据代码中写的方法找不到vcvarsall.bat的位置这就很好办了,我们直接告诉他vcvarsal原创 2021-04-23 11:46:45 · 574 阅读 · 3 评论