深度学习和计算机视觉
文章平均质量分 87
Terrence Shen
学无止境
展开
-
YOLOv8添加注意力机制小总结
注意力机制(Attention Mechanism)源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。上述机制通常被称为注意力机制。人类视网膜不同的部位具有不同程度的信息处理能力,即敏锐度(Acuity),只有视网膜中央凹部位具有最强的敏锐度。简而言之,注意力机制源于自然界人类视觉的研究。人类的视觉会天然地进行一个抉择,就是选择性地关注所有信息的一个部分,同事就会忽略其他可见的信息。就属于是合理的利用有限的信息处理资源。原创 2023-09-15 03:20:50 · 5485 阅读 · 3 评论 -
CNN 经典模型:AlexNet
这一层中每个 GPU 都有 128 个卷积核,每个卷积核的尺寸是 3×3×192,卷积的步长是 1 个像素,经卷积后的尺寸为 (13+1+1-3)/1+1=13,每个 GPU 中有 13×13×128 个卷积核,2 个 GPU 卷积后生成 13×13×256 的像素层。第四层输入数据为第三层输出的 2 组 13×13×192 的像素层,类似于第三层,为便于后续处理,每幅像素层的上下左右边缘都填充 1 个像素,填充后的尺寸变为 (13+1+1)×(13+1+1)×192,分布在两个 GPU 中进行运算。原创 2023-04-01 22:33:34 · 317 阅读 · 0 评论 -
Yolov5-模型配置文件(yolov5l.yaml)讲解
YOLOv5 的yaml文件解析与理解原创 2023-04-01 06:32:32 · 3553 阅读 · 0 评论 -
DenseNet
YOLO系列是一个大杂烩,把很多的前沿技术都融合到一起了,CSP结构借鉴了DenseNet的想法,所以,开始啃DenseNetDenseNet 是一种在计算机视觉领域得到广泛应用的神经网络架构。它旨在解决深度神经网络中梯度消失的问题。DenseNet 背后的想法是以密集的方式将每一层连接到每一层。这意味着每一层都接收来自所有先前层的输入,并将其输出提供给所有后续层。这创建了一个紧凑高效的网络架构,可以有效地学习特征。原创 2023-03-30 22:10:54 · 77 阅读 · 0 评论 -
YOLOv5和YOLOv7结构
YOLOv5和v7常见的两种结构示意图,帮助理解原创 2023-03-30 21:01:12 · 178 阅读 · 0 评论 -
darknet-19与darknet53
Darknet是最经典的一个深层网络,结合Resnet的特点在保证对特征进行超强表达的同时又避免了网络过深带来的梯度问题,主要有Darknet19和Darknet53。原创 2023-03-30 21:28:56 · 1145 阅读 · 0 评论