![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CV
文章平均质量分 80
Dear_林
知其然知其所以然
展开
-
组卷积和深度可分离卷积
图b表示深度卷积,图c表示分点卷积,两者合起来就是深度可分离卷积,深度卷积负责滤波,尺寸为Dk×Dk×1,共M个,作用在输入的每个通道上;第一张图是标准的卷积操作,若输入的特征图是H×W×c1,卷积核的尺寸为h1×w1×c1,输出特征图的尺寸为H×W×c2,那么标准卷积层的参数量为h1×w1×c1×c2。图a表示标准卷积,假设输入的特征图尺寸为Df×Df×M,卷积核尺寸为Dk×Dk×M,输出特征图的尺寸为Df×Df×N,标准卷积层的参数量为Dk×Dk×M×N。原创 2022-09-30 16:35:43 · 488 阅读 · 1 评论 -
yolov1代码解读
前面已经对yolov1的原理做了一个了解,下面就来看一下yolov1的代码实现过程yolov1的代码倒是比Faster-Rcnn简单多了,但是一些逻辑顺序和Faster-Rcnn差不多● pascal_voc.py:对图片数据和XML数据进行解析和预处理;● yolo_net.py:搭建yolo v1网络,设置yolo v1的损失函数;● train.py 和test.py :一个用来训练模型,一个用来测试模型。1、pascal_voc.py这部分主要是解析xml文件,读取图片数据和对数据进行预原创 2022-03-15 14:08:56 · 7967 阅读 · 2 评论 -
You Only Look Once: Unified, Real-Time Object Detection论文解读
论文:链接代码:TensorFlow版本核心思想:将整张图片作为网络的输入,直接在输出层对BBox的位置和类别进行回归。回顾:两阶段目标检测的实现过程:1、采用滑动窗口,对每个窗口进行分类和位置修正;2、用RPN网络提取候选区域,特征图对应的候选区域经过roipooling得到所需特征;3、SSD继承RPN类似的anchor机制,设定预设框并对每个预设框赋予groundtruth,全卷积网络训练目标。1、网络结构yolo的网络结构包含24个卷积层+2个全连接层组成。简单地说,就是将一张输入的图片原创 2022-03-15 14:07:08 · 541 阅读 · 0 评论