![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
网络模型
文章平均质量分 61
seven_不是赛文
从此就是个烂人啦
展开
-
深度学习的MASK
借用知乎网友的解析:mask就是掩膜,图片中有一个圆形物体,你从一张纸上剪掉一个和该物体一模一样大小的圆,把这张纸蒙在图片上,这时候你只能看见这个圆形物体,这张纸就是mask了我的理解给我一种信息过滤器的感觉构建张量的过滤器按照上述定义,非线性激活函数Relu(根据输出的正负区间进行简单粗暴的二分)、dropout机制(根据概率进行二分)都可以理解为泛化的mask操作。从任务适应性上,mask在图像和自然语言处理中都广为应用,其应用包括但不局限于:图像兴趣区提取、图像屏蔽、图像结构特征提取、语原创 2022-01-16 17:05:15 · 2138 阅读 · 0 评论 -
FPN与U-Net
通常的CNN网络结构如下图所示自底向上卷积,然后使用最后一层特征图进行预测,像SPP-Net,Fast R-CNN,Faster R-CNN就是采用这种方式,即仅采用网络最后一层的特征。那么就会出现一个问题,如果我们的那个feat_stride=16(图片转化成特征图谱后缩小的尺寸倍数),表示若原图大小是1000600,经过网络后最深一层的特征图大小是6040,可理解为特征图上一像素点映射原图中一个1616的区域**;那原图中有一个小于1616大小的小物体,可能就会被忽略掉,检测不到**FPN(Fea原创 2021-11-10 10:24:22 · 2614 阅读 · 0 评论 -
全卷积(fully convolution)
全卷积模型:将之前我们cnn模式后面的全连接层换成卷积层,所以整个网络都是卷积层。其最后输出的是一张已经标记好的热图,而不是一个概率值。第6、7、8层分别是长度是4096、4096、1000的一维向量。最后输出一个1000维的向量表示输入图像属于每一类的概率。在FCN中第6、7、8层都是通过卷积得到的,卷积核的大小全部是1 * 1,第6层的输出是4096 * 7 * 7,第7层的输出是4096 * 7 * 7,第8层的输出是1000 * 7 * 7(7是输入图像大小的1/32),即1000个大小是7*原创 2021-11-10 09:00:05 · 3439 阅读 · 0 评论 -
双图层实例分割BC net
看下对比图提出的遮挡感知下的双图层实例分割网络BCNet结论作者在大量的数据集COCO、COCOA以及KINS上对算法进行了验证,效果均可原创 2021-10-10 19:36:30 · 304 阅读 · 0 评论 -
ECCV2020:Corner Proposal Network for Anchor-free, Two-stage Object Detection
作者思路理解anchor free可以检测那些奇怪形状物体(anchor based可能检测不出来)但是它带来的问题是大量误检,所以使用二阶段提高精度减少误检。二阶段的anchor free目标检测网络第一阶段通过角点提取出感兴趣区域,第二阶段对感兴趣区域进行预测和回归虽然用的是corner net的关键点提取方法,但是他并不是用提取出来的左上角和右下角特征与gt进行iou对比,来判断他是否属于一个目标。而是使用将所有有效的角点组合作为潜在对象,并且借用二阶段的思想,即训练一个分类器,根据对应的区原创 2021-09-14 12:00:10 · 187 阅读 · 0 评论 -
corner net(学习记录)
一张图解释网络卷积得到目标的左上角和右下角的热图,然后embedding出他们的一个原创 2021-09-11 17:05:52 · 142 阅读 · 0 评论 -
特征与RoI对齐
RefineDet两次回归用的特征都是与RoI不对齐的特征黄色是anchor,红色是GT,紫色是learned anchor,由anchor回归到learned anchor是用feature map上黑色特征点这一特征(D维向量)形成的,(这个黑色特征是在上一层输出feature map的九个点卷积得到的),这9个相邻的点所组成的区域映射到原图,也就是原图中灰色区域这一部分,换句话说,这一黑色特征的全部信息基本都来自于原图的灰色部分,*但是显然,这一灰色区域并没有完全包含整个长颈鹿,用这一区域所得到的原创 2021-08-26 10:42:31 · 551 阅读 · 0 评论 -
FASF模块(区分开相同位置不同尺度的目标的进阶操作)
优势精度提升,误检减少创新在anchor based 的分支上面加多了一个anchor free的分支对比以前之前,我们做回归分类的时候,对于一个图片里面有很多不同尺寸目标的做法,普遍是输入到金字塔网络(FPN)里面,根据anchor的大小将其分配到固定的特征层进行分类…这里我们使用的anchor都是那种固定了大小、比例的,正是因为这样直接划分的方式导致了anchor并不能最好的回归所以,本文里面提到的就是:先利用anchor free,根据某个自己设定的标准,找出最优特征层,然后将对应anc原创 2021-08-16 12:07:45 · 376 阅读 · 0 评论 -
IOU Loss
目标检测任务的损失函数一般由Classificition Loss(分类损失函数)和Bounding Box Regeression Loss(回归损失函数)两部分构成。IoU是指预测检测框A和真实检测框B的交并比,是目标检测中最常用的指标,在anchor-based的方法中,他的作用不仅用来确定正样本和负样本,还可以用来作为输出框(predict box)和ground-truth的距离的评价指标和训练Loss。参考文章目标检测中的4种IoU Loss...原创 2021-08-16 10:25:19 · 132 阅读 · 0 评论 -
SSD的金字塔
接上上一篇论文SSDSSD将预测层设计为不对称的沙漏结构。对于300×300输入图像,使用六种尺度的特征图来预测目标。Scale-1特征图来自骨干网的中间层,具有最大的分辨率(38×38),以处理图像中的小目标。其余五个规模均位于主干子网的顶部。然后,在两个相邻尺度的特征图之间采用具有瓶颈结构的普通过渡层(1×1转换层以减少特征图的数量,加上3×3转换层)[33,9]。学习一半,再利用一半。SSD 300网络结构图Faster R-CNN结构可以看到YOLO在卷积层后接全连接层,即检测时只利用原创 2021-03-28 12:23:52 · 443 阅读 · 0 评论 -
YOLOX学习记录
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码原创 2021-08-15 18:03:48 · 365 阅读 · 0 评论 -
可解释网络protopnet,xprotopnet
学习目标:提示:这里可以添加学习目标例如:一周掌握 Java 入门知识学习内容:提示:这里可以添加要学的内容例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、 掌握循环语句学习时间:提示:这里可以添加计划学习的时间例如:1、 周一至周五晚上 7 点—晚上9点2、 周六上午 9 点-上午 11 点3、 周日下午 3 点-下午 6 点学习产出:提示:这里统计学习计划的总量例如:1、 技术笔记 2 遍2、CSDN 技术博客 3 篇原创 2021-07-02 18:49:20 · 1923 阅读 · 0 评论 -
RepVGG解析2
网络结构:在原始的vgg模型上引入残差连接和1*1卷积Repvgg block 的对应代码:self.rbr_identity = nn.BatchNorm2D(num_features=in_channels) if out_channels == in_channels and stride == 1 else None self.rbr_dense = conv_bn(in_channels=in_channels, out_channels=out_channels, kernel_s原创 2021-06-13 14:17:43 · 448 阅读 · 1 评论 -
RepVGG无敌版解析1
我总结出了三大点吧模型思想模型backbone选择思想的使用(即多分支变单分支)重参数化 : 多路模型(train)转换单路模型(test)模型思想结构重参数化思想。这是由清华大学在读博士丁霄汉提出的,它可以使模型更快更强感兴趣可以去看看ACNet这个论文,这里面就是很好的参数重构的例子他里面有提到一个不同大小的卷积核可以相加这个point,挺有意思的(如图)不是本章重点我就不解析了啊哈哈哈哈模型backbone选择作者选择了vgg作为backbone,原因有三:快(3*3的卷积层堆叠而成原创 2021-06-12 21:44:09 · 545 阅读 · 0 评论 -
Yolo v4的学习
文章目录前言route层是yolo中提出的一个层级概念,在一些文章中也叫做路由层。它的作用是在当前层引出之前卷积所得到的特征层一、 YOLO V4的网络结构二、分析各部分1.CSPDarknet53**1.1 Mish激活函数**1.2 Darknet53(yolo v3使用)1.3 CSPDarknet53网络结构图(YOLO V4使用)3.Neck:SPP+PAN3.1 SPP是Spatial pyramid pooling的缩写,即空间金字塔池化。3.2 PAN是Path Aggregation N.原创 2021-03-28 14:21:13 · 329 阅读 · 1 评论 -
图像分割模型
先上采样再下采样FCN因为fcn取消了cnn最后三层的全连接层,变成卷积层,使得它可以接受任何尺寸的输入图像。尝试了三种预测结构直接进行32倍的上采样,然后逐个像素预测8s和16s则采用了更多层的浅层特征和上采到相同尺寸特征图在进行相加融合。U-NET在FCN的论文中提到8s的效果是最好的,如果我们将16s和32s去掉,转过来看,其实也是给u型结构u net相比较fcn,他的上采样特征图拥有更多的通道数。FCN不同的图像采用的是相加融合,但是unet采用的是拼接。并且在拼接时浅层的特原创 2021-03-13 17:34:13 · 1448 阅读 · 0 评论