![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
主流算法解析
文章平均质量分 73
⊙月
勇前不弃
展开
-
ViT(vision transformer)原理快速入门
本专题需要具备的基础:了解深度学习分类网络原理。 了解2017年的transformer。Transformer 技术里程碑:ViT简介时间:2020年CVPR论文全称:《An Image is Worth 16*16 Words: Transformers for Image Recognition at Scale》发明人:谷歌团队简介:论文中提出了 Vision Transformer (ViT),能直接利用 Transformer 对图像进行分类,而不需要卷.原创 2021-12-09 10:08:38 · 19562 阅读 · 9 评论 -
生成式对抗网络的原理和实现方法
GAN:generative adversarial network时间:2014年,Ian Goodfellow和Yoshua Bengio的实验室中相关人员。gan背后的想法是,你有两个网络,一个生成器GGG和一个鉴别器DDD,互相竞争。生成器生成传递给鉴别器的“假”数据。鉴别器还能看到真实的训练数据,并预测它接收到的数据是真的还是假的。GAN的作用:训练出一个“造假机器人”,造出来的东西跟真的几乎类似。GAN的实现原理:两个网络,一个生成器网络GGG和一个鉴别器网络DDD,两者互相竞争来提升自原创 2021-09-17 17:42:49 · 1599 阅读 · 0 评论 -
什么是Encoder-Decoder、Seq2Seq、Attention?
1 简介发明时间:2014年由 [Bahdanau et al. 2014] 正式提出。 作用: Attention机制可以让神经网络更多的关注到输入中相关的信息,并减少对无关信息的注意。就像当我们看一副图,我们往往会对其中感兴趣的那部分更加注意,Attention机制也以类似的方式帮助神经网络更好的利用输入的信息。 有助于提升模型的可解释性。 1.1 Attention发明的背景2014年, Seq2Seq模型 [Sutskever et al. 2014] 正式提出, 并以其优异的表原创 2021-09-07 16:44:15 · 2500 阅读 · 1 评论 -
一幅图真正理解LSTM、BiLSTM
1 前言本文不是RNN系列入门,而是对RNN、LSTM、BiLSTM的内部结构和输入输出做透彻的剖析。RNN:循环神经网络 LSTM:长短期记忆网络 BiLSTM:双向长短期记忆网络重要的先验知识:本质上单个RNN cell是在多个时间步上展开的形式,也可以理解为RNN是神经网络在时序上的权重共享(CNN相当于空间上的权重共享),LSTM也都是一样。1.1 RNN回忆与概览1.2 BiLSTM回忆与概览LSTM内部结构相对RNN做了改进,BiLSTM中Bi指的是Bi-di原创 2021-09-01 21:19:11 · 50238 阅读 · 24 评论 -
CenterNet算法快速入门
目录1 简介2 网络结构3 损失函数3.1 heatmap loss(改造的Focal Loss)3.2 长宽预测loss(L1损失函数)3.3 中心点偏移值loss(L1损失函数)4 扩展:关节点预测和3D任务4.1 人体关节点预测4.2 3D目标检测1 简介时间:2019年论文《Objects as Points》 特点: 不需要anchor、也不需要NMS,模型结构简单、速度快、精度高(比yolo3高4个点)! 只需少量修改head,就可以改造成原创 2021-08-30 16:36:26 · 1040 阅读 · 0 评论 -
度量学习:ArcFace算法和工程应用总结
需要的基础:了解深度学习分类网络原理即可。 主题和收获:以深度学习中的ArcFace算法为案例,获得对度量学习领域举一反三的领悟。1 度量学习简介度量学习(Metric Learning)通俗的说就是相似度学习。例如,如果要计算两张人脸图片的相似度,如何度量图片之间的相似度,并使得不同人的人脸图片相似度小而相同人的人脸图片相似度大就是度量学习的目标。综上,以人脸识别(不是人脸检测)为例子,用程序和算法实现此功能,要解决3个问题:用什么东西作为某一个人的人脸的特征基准? 答案:因为不同的原创 2021-08-25 18:31:42 · 1880 阅读 · 5 评论 -
V2V-PoseNet算法和应用详解(3D关节点估计领域)
本文主要梳理V2V关节点估计算法的原理、网络结构、以及工程应用。 虽然V2V是2017年的算法,但是其3D点云处理流程和效果还是很经典的,值得作为入门3D深度学习领域的一个窗口。1 算法部分V2V-PoseNet基本介绍发明时间:2017年 功能:3D关节点估计(如应用于手掌关节点估计) 输入数据:一张包含目标的depth图。(如用Kinect、realsense等传感器采集的的depth图) 输出结果:目标物体关节点的X,Y,Z坐标值。 两句话概括创新点: 第一句话:传统方原创 2021-08-18 22:02:55 · 2506 阅读 · 6 评论 -
SSD算法详解
目录SSD算法在目标检测领域的位置:SSD算法口头概述:优缺点网络结构图正负样本选择:损失函数:其他细节:SSD算法在目标检测领域的位置:SSD算法口头概述:输入:300*300*3的图像。 骨干网络:VGG 16 再加10个卷积层 6个特征图输出:从骨干网中6个不同深度位置抽取feature map,每个位置的feature map会经过两个输出路线,一个路线feature map经过1个卷积层,直接输出4或6个anchor框的坐标回归信息。另一个路线fea原创 2021-08-16 19:35:03 · 2164 阅读 · 0 评论 -
Yolo5算法详解
Yolo5核心的一些东西:输入端: mosaic、仿射变换等。 自适应锚框计算。 自适应图片缩放。(能提升37%推理速度) Backbone:Focus结构(提升推理速度)、新的CSP结构。 Neck:SPP、FPN+PAN的结构, 输出端: 3个临近grid cell负责预测目标,相当于增加了2倍正样本量,极大加速收敛,并修改了预测框回归公式(具体见解析图) 刚开始是边框回归用GIOU-Loss,后面版本又改成CIOU-Loss。 其他细节改动:抛弃了基于max i原创 2021-08-12 14:43:53 · 1200 阅读 · 0 评论 -
Yolo4算法详解
图形化有助于更好的理解和记忆,图有点大7411 x 6078,内容有如下几个模块构成:Yolo4相对于Yolo3的改进总结。 Yolo4详细的网络结构。 Yolo4的输出物理意义。(跟YOLO3一样) Yolo4的anchor回归机制。(跟YOLO3一样) Yolo4的损失函数。(相对Yolo3,把其中定位损失部分,替换为CIOU-loss公式) 介绍一些损失函数发展历史: 定位损失:SmoothL1(Fast RCNN), IOU(2016), GIOU(2019), DIOU(2020)原创 2021-08-10 18:09:04 · 284 阅读 · 1 评论 -
入门强化学习(Q-learning→DQN→DDQN)
基础:只要具备CNN分类算法的基本认识。讲解内容:内容主要通过《飞翔小鸟》游戏为例,探究如下2个问题: 强化学习原理:以Q-learning算法为例。 深度强化学习原理:以DQN、DDQN算法为例。 然后大概讲下DDQN算法,如何在更复杂的解锁任务中应用和设计。学完收获:认真看完所有细节内容,基本就能了解一种强化学习和一种深度强化学习的整个过程,其他算法可以举一反三。备注:由于资料大多从PPT中截取出来,转成文章可能会有一些不理解的地方,如有细节疑问可以留言提出来。0原创 2021-08-06 19:22:08 · 4553 阅读 · 1 评论 -
Yolo3算法详解
形象化记忆还是比文字好。查阅了几十篇资料,认真剖析了Yolo3的网络结构、anchor回归机制、损失函数,如下:原创 2021-07-28 22:19:32 · 217 阅读 · 0 评论 -
Yolo2算法详解
原创 2021-07-23 18:48:20 · 190 阅读 · 0 评论 -
AI视频行为分析系统项目复盘——技术篇4:deepsort原理图
初次接触deepsort时,快速了解过其多目标跟踪原理,记录了一篇《deepsort原理快速弄懂——时效比最高的》。但是其细节和重要参数项还是很模糊,应对具体原创 2021-07-13 19:29:10 · 2525 阅读 · 0 评论 -
deepsort原理快速弄懂——时效比最高的
转载自:https://www.cnblogs.com/liuboblog/p/12105473.html转载 2021-06-04 11:34:15 · 15181 阅读 · 0 评论 -
CV算法评判标准:混淆矩阵、准确率、精确率、召回率、特异度、P-R曲线、AP、mAP、coco标准
目录1 混淆矩阵2 准确率、精确率(查准率)、召回率(查全率)、特异度2.1 准确率2.2 精确率2.3 召回率2.4 特异度3 ★★★P-R曲线、AP、mAP4 coco的评价标准和解读方式1 混淆矩阵2 准确率、精确率(查准率)、召回率(查全率)、特异度2.1 准确率2.2 精确率2.3 召回率2.4 特异度3 ★★★ P-R曲线、AP、mAP3个概念的物理意义,及其计算过程见下面这个流程图:4 coco的.原创 2021-01-05 21:20:26 · 1434 阅读 · 4 评论 -
CV算法复现(分类算法6/6):MobileNet(2017年V1,2018年V2,2019年V3,谷歌)
1原创 2021-01-03 18:47:14 · 483 阅读 · 0 评论 -
CV算法复现(分类算法5/6):ResNet(2015年 微软亚洲研究院)
致谢:霹雳吧啦Wz:https://space.bilibili.com/181616091 本次要点1.1 Python库语法1.2 深度学习理论BN层:使feature map(指一批图的,而不是一张图)满足均值为0,方差为1的分布。 注意1:如果要使用BN层,则batch size应该尽可能大,因为这样更接近全体数据集的均值和方差,而batchsize如果为1,可能还不如不用。 注意2:BN建议放在卷积层和激活层(如Relu)之间,且卷积不要使用偏置bia...原创 2021-01-03 18:46:15 · 482 阅读 · 0 评论 -
CV算法复现(分类算法4/6):GoogLeNet(2014年 谷歌)
致谢:霹雳吧啦Wz:https://space.bilibili.com/18161609目录致谢:霹雳吧啦Wz:https://space.bilibili.com/181616091 本次要点1.1 pytorch框架语法2 网络简介2.1 历史意义2.2 网络亮点2.3 题外话2.3 网络结构3 代码结构3.1 model.py3.2 train.py3.3 predict.py1 本次要点1.1 pytorch框架语法nn.MaxPoo原创 2021-01-03 18:45:28 · 292 阅读 · 2 评论 -
CV算法复现(分类算法3/6):VGG(2014年 牛津大学)
致谢:霹雳吧啦Wz:https://space.bilibili.com/181616091 本次要点Python库语法原创 2021-01-03 18:44:59 · 408 阅读 · 0 评论 -
CV算法复现(分类算法2/6):AlexNet(2012年 Hinton组)
网络架构原创 2021-01-03 18:43:56 · 489 阅读 · 1 评论 -
CV算法复现(分类算法1/6):LeNet5(1998年 LeCun)
感谢:霹雳吧啦Wz:https://space.bilibili.com/18161609记忆要点Python库语法PIL 和 numpy 中维度顺序:H*W*CPytorch框架语法pytorch 中 tensor 维度顺序:C*H*W item():得到元素张量里面的元素值。(将张量值变为可计算的值?) 0 环境win10,GPU 1060 3G pytorch 1.4 Python 3.61 网络结构2 代码结构...原创 2020-12-30 20:21:32 · 311 阅读 · 2 评论 -
算法了解:RCNN、SPP-Net、Fast-RCNN、Faster-RCNN
1 RCNN(2014年)1.1 发明背景2012年AlexNet在ImageNet举办的ILSVRC中大放异彩,R-CNN作者受此启发,尝试将AlexNet在图像分类上的能力迁移到PASCAL VOC(1万图像,20类,标定类别和位置)的目标检测上。这就要解决两个问题:如何利用卷积网络去目标定位 如何在小规模的数据集上训练出较好的网络模型。1.2 解决思路针对问题1,R-CNN利用候选区域的方法(Region Proposal),这也是该网络被称为R-CNN的原因:Regions wi原创 2020-12-14 21:04:00 · 516 阅读 · 0 评论 -
Yolo1算法解析
1 结构概览YOLO结构就是单纯的卷积 + 池化 + 全连接层,只是最后的输出层用线性函数做激活函数,因为需要预测bounding box的位置(数值型),而不仅仅是对象的概率。YOLO结构如下:原创 2020-11-07 14:55:42 · 1007 阅读 · 0 评论