计算机视觉
文章平均质量分 96
我是小将
Make your hands dirty!
展开
-
PVT:可用于密集任务backbone的金字塔视觉transformer
自从ViT之后,关于vision transformer的研究呈井喷式爆发,从思路上分主要沿着两大个方向,一是提升ViT在图像分类的效果;二就是将ViT应用在其它图像任务中,比如分割和检测任务上,这里介绍的**PVT(Pyramid Vision Transformer)**就属于后者。PVT相比ViT引入了和CNN类似的金字塔结构,使得PVT像CNN那样作为backbone应用在dense prediction任务(分割和检测等)。CNN结构常用的是一种金字塔架构,如上图所示,CNN网络一般可以划分为原创 2021-04-05 18:25:17 · 1393 阅读 · 1 评论 -
CV中的无监督学习方法:MoCo
无论是CV还是NLP领域,学习一个好的特征或者表达至关重要。对于NLP,通过无监督方法学习特征已经取得好大的成功,但是在CV领域,目前主流的方案还是采用ImageNet上的有监督pretrain模型。这是因为NLP任务的输入如words属于一个离散空间,而CV任务的输入图片属于一个高维连续空间。不过,目前的一些CV领域的无监督学习方法也取得了一些较大的进展,这里介绍的MoCo就是一种比较流行的无监督学习方法。对比学习无监督学习方法主要用来学习好的特征以用于特定的下游任务,这类方法往往需要建立一个代理任原创 2021-03-20 09:13:50 · 1905 阅读 · 0 评论 -
Focal Loss和它背后的男人RetinaNet
文章目录Focal LossRetinaNetBackboneAnchordetection模块模型初始化模型训练与预测与其他模型的对比参考说起Focal Loss,相信做CV的都不会陌生,当面临正负样本不平衡时可能第一个想到的就是用Focal Loss试试。但是怕是很多人会不知道这篇论文中所提出的one stage目标检测模型RetinaNet,这也难怪,就连论文里面也说了RetinaNet模...原创 2020-04-06 21:12:56 · 1055 阅读 · 0 评论 -
ShuffleNetV2:轻量级CNN网络中的桂冠
文章目录设计理念网络结构TensorFlow上的实现参考近来,深度CNN网络如ResNet和DenseNet,已经极大地提高了图像分类的准确度。但是除了准确度外,计算复杂度也是CNN网络要考虑的重要指标,过复杂的网络可能速度很慢,一些特定场景如无人车领域需要低延迟。另外移动端设备也需要既准确又快的小模型。为了满足这些需求,一些轻量级的CNN网络如MobileNet和ShuffleNet被提出,...原创 2020-04-05 14:47:32 · 793 阅读 · 1 评论 -
轻量级CNN网络之MobileNetv2
文章目录Depthwise Separable ConvolutionLinear BottlenecksInverted Residuals网络结构TensorFlow上的实现小结参考MobileNet网络是Google提出主要应用在移动端的轻量级CNN网络,之前的文章(CNN模型之MobileNet)已经对MobileNetv1版本进行了详细的介绍。目前,Google已经公开了Mobile...原创 2020-04-05 14:39:29 · 2036 阅读 · 0 评论 -
最后一届ImageNet冠军模型:SENet
文章目录前言主体思路Squeeze-and-Excitation (SE) 模块Squeeze操作Excitation操作SE模块在Inception和ResNet上的应用模型效果SE模块的实现小结参考文献前言在深度学习领域,CNN分类网络的发展对其它计算机视觉任务如目标检测和语义分割都起到至关重要的作用,因为检测和分割模型通常是构建在CNN分类网络(称为backbone)之上。提到CNN分...原创 2020-04-05 13:46:24 · 2181 阅读 · 0 评论 -
人人必须要知道的语义分割模型:DeepLabv3+
文章目录整体架构空洞卷积空间金字塔池化(ASPP)Decoder改进的Xception模型小结参考文献图像分割是计算机视觉中除了分类和检测外的另一项基本任务,它意味着要将图片根据内容分割成不同的块。相比图像分类和检测,分割是一项更精细的工作,因为需要对每个像素点分类,如下图的街景分割,由于对每个像素点都分类,物体的轮廓是精准勾勒的,而不是像检测那样给出边界框。图1 街景分割图像分割可以分...原创 2020-04-05 13:40:45 · 2508 阅读 · 1 评论 -
PyTorch分布式训练简明教程
文章目录DistributedDataParallel内部机制实例讲解普通单卡训练分布式训练混合精度训练(采用apex)题外话参考神经网络训练加速的最简单方法是使用GPU,对弈神经网络中常规操作(矩阵乘法和加法)GPU运算速度要倍超于CPU。随着模型或数据集越来越大,一个GPU很快就会变得不足。例如,BERT和GPT-2等大型语言模型是在数百个GPU上训练的。对于多GPU训练,需要一种在不同GP...原创 2020-04-05 13:15:26 · 10558 阅读 · 5 评论 -
VoVNet:实时目标检测的新backbone网络
文章目录高效网络设计要素OSA(One-Shot Aggregation)模块VoVNetVoVNet在检测模型上的效果VoVNetV2VoVNetV2的PyTorch实现参考目前基于深度学习的目标检测模型无不依赖CNN分类网络来作为特征提取器,如SSD采用VGG,YOLO采用DarkNet,Faster R-CNN采用ResNet,我们一般称这些网络为目标检测模型的backbone。ResNe...原创 2020-04-04 22:10:37 · 15462 阅读 · 6 评论 -
DenseNet:比ResNet更优的CNN模型
码字不易,欢迎给个赞!欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110)文章目录前言设计理念网络结构实验结果及讨论使用Pytorch实现DenseNet小结参考文献前言在计算机视觉领域,卷积神经网络(CNN)已经成为最主流的方法,比如最近的GoogLenet,VGG-19,Incepetion等模型。CNN史上的一个里程碑事件是ResNet模型的出现,Re...原创 2019-01-01 21:14:50 · 19177 阅读 · 4 评论 -
你知道如何计算CNN感受野吗?这里有一份详细指南
码字不易,欢迎给个赞! 欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110)固定大小的CNN特征图可视化感受野计算公式附文小结本文翻译自A guide to receptive field arithmetic for Convolutional Neural Networks,原作者保留版权。感受野(receptive field,...翻译 2018-06-11 09:03:28 · 5762 阅读 · 1 评论 -
目标检测|YOLOv2原理与实现(附YOLOv3)
码字不易,欢迎给个赞! 欢迎交流与转载,文章会同步发布在公众号:机器学习算法工程师(Jeemy110)欢迎关注机器学习算法工程师专栏和公众号前言YOLOv2的改进策略Batch NormalizationHigh Resolution ClassifierConvolutional With Anchor BoxesDimension ClustersNew Netw...原创 2018-06-12 15:56:17 · 6498 阅读 · 3 评论 -
目标检测算法之SSD
码字不易,欢迎给个赞!欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110)目录目录前言设计理念网络结构训练过程预测过程性能评估TensorFlow上的实现小结参考文献前言目标检测近年来已经取得了很重要的进展,主流的算法主要分为两个类型:(1)two-stage方法,如R-CNN系算法,其主要思路是先通过启...原创 2018-04-06 15:17:33 · 101516 阅读 · 40 评论 -
综述|基于深度学习的目标检测(一)
码字不易,欢迎给个赞!欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110)目录目录概述数据集和性能指标数据集性能指标R-CNNSPP-netFast R-CNNFaster R-CNN参考文章概述图像分类,检测及分割是计算机视觉领域的三大任务。图像分类模型(详情见这里)是将图像划分为单个类别,通常对...原创 2018-03-18 13:45:59 · 65973 阅读 · 6 评论