计算机视觉
文章平均质量分 84
wL魔法师
这个作者很懒,什么都没留下…
展开
-
【评价标准】目标检测AP
写在前面目标检测的论文中常常会出现mAP的指标,那到底是则么计算的,在下面进行简单叙述。目标检测中的常见指标:TP(True Positive):IoU>0.5的检测框的数量(同一Ground Truth只能计算一次)FP(False Positive):IoU<=0.5的检测框(或者是检测到同一GT的多余检测框的数量)FN(False Negative):没有检测到的GT的数量Precision:TP/(TP+FP) 模型预测的所有目标中,预测正确的比例Rec.原创 2021-02-07 21:23:06 · 1541 阅读 · 0 评论 -
【DATA】PASOAL VOC 2012
PASCAL VOCPASCAL VOC挑战在2005年至2012年间展开。 目标检测技术的基准之一。该数据集中有20个分类。该数据集包含11530张用于训练和验证的图像, 其中感兴趣区域有27450个标定。PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集,从2005年到2012年每年都会举行一场图像识别challenge。该挑战的主要目的是识别真实场景中一些类别的物体。在该挑战中,这是一个监督学习的问题,训练集以带标签的图片的形式给出。Pascal VOC(2005~2012)原创 2021-02-07 15:31:43 · 238 阅读 · 1 评论 -
计算机视觉目录导航
1.backboneAlexNet论文Alexnet实现python版本VGGGoogleNet V1+V2+V3+V4ResNet+ResNeXt2.attention 机制attention 机制在CV中的回顾3.目标跟踪2019目标跟踪综述4.系统及编译平台ubuntu20.04 nv驱动+cuda+cudnn+anaconda3安装教程使用pytroch可视化工具时报错5.其他损失函数 - 交叉熵损失函数...原创 2021-02-02 11:17:14 · 226 阅读 · 0 评论 -
【论文】ResNet+ResNeXt
门控机制High way net work原创 2021-02-01 15:50:08 · 324 阅读 · 0 评论 -
【转载】损失函数 - 交叉熵损失函数
MSE转载自:损失函数 - MSE数理统计中均方误差是指参数估计值与参数值之差平方的期望值,记为MSE。MSE是衡量“平均误差”的一种较方便的方法,MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。SSE(和方差)在统计学中,该参数计算的是拟合数据和原始对应点的误差的平方和,计算公式为:其中是真实数据,是拟合的数据, ,从这里可以看出SSE接近于0,说明模型选择和拟合更好,数据预测也越成功。缺点:使用MSE的一个缺点就是其偏导值在输出概率..转载 2021-01-31 15:54:35 · 923 阅读 · 0 评论 -
【论文】GoogleNet V1+V2+V3+V4
写在前面googlenet是由google团队在2014年在ilsvrc时提出的,并获得了多项冠军。googlenet v1[1]版本发表在CVPR2015上。由Hebbian principle 和多尺度Gabor滤波器提取特征[2]提出了inception模块。训练时通过辅助损失,模型达到了22层超过了vgg,但参数只有它的1/12,主要是减少在全连接层。GoogleNet v1Inception 通过多尺度卷积得到了更丰富的特征,同时在提出inception模块后,进行了改...原创 2021-01-29 21:28:04 · 523 阅读 · 2 评论 -
【综述】attention 机制在CV中的回顾
一、写在前面从网络结构本身的角度出发,可以从以下四个维度来提升卷积神经网络的性能,分别是:深度(ResNet)、宽度(WideResNet)、基数(ResNeXt)和注意力(SENet)。一般来说,网络越深,所提取到的特征就越抽象;网络越宽,其特征就越丰富;基数越大,越能发挥每个卷积核独特的作用;而注意力则是一种能够强化重要信息抑制非重要信息的方法,也是本文重点阐述的对象。注意力(attention)其实是一个非常常见,但是又会被忽略的事实。如图,往往你会盯着婴儿脸,文字,毛巾等高频信息,其他的自然原创 2021-01-20 12:05:16 · 2550 阅读 · 0 评论 -
【综述】Deep Learning for Visual Tracking: A Comprehensive Survey-2019
Abstract视觉目标跟踪是计算机视觉中最受欢迎但最具挑战性的研究课题之一。鉴于问题的不适定性质及其在广泛的现实世界场景中的流行,已经建立了一些大规模的基准数据集,在这些数据集上开发了相当多的方法,并在近年来取得了重大进展-主要是通过最近基于深度学习(DL)的方法。本调查旨在系统地研究当前基于DL的视觉跟踪方法、基准数据集和评估度量。它还广泛地评估和分析了领先的视觉跟踪方法。首先,从网络体系结构、网络开发、视觉跟踪网络训练、网络目标、网络输出和相关滤波器优势的开发六个关键方面总结了基于DL的方法...原创 2021-01-13 19:21:38 · 3128 阅读 · 1 评论 -
【论文】Know Your Surroundings: Exploiting Scene Information for Object Tracking -2020
Abstract目前最先进的跟踪器只依赖于目标外观模型来定位每个帧中的对象。然而,在出现例如快速的外观变化或存在干扰器对象的情况下,这种方法很容易失败,因为仅有目标外观模型不足以进行鲁棒跟踪。 在这种情况下,了解周围场景中其他物体的存在和位置是非常有益的。 这些场景信息可以通过序列传播,例如,可以显式地避免干扰对象并消除目标候选区域。在本文中,我们提出了一种新的跟踪体系结构,它可以利用场景信息进行跟踪。 我们的跟踪器表示密集的局部状态向量等信息,例如,如果局部区域是目标、背景或干扰器,则可以进...原创 2020-12-23 20:53:03 · 911 阅读 · 1 评论 -
【论文】VGG
主要成果:1.研究深度与精度关系2. 3*3卷积,1*13. 16-19层4. 定位冠军,分类亚军5. 公开模型研究背景:1.CNN(Alexnet)2.小卷积(ZFNet)3.Dense稠密测试(OverFeat)4.1*1卷积(NIN)(VGG中用了两处,第一次是D模型增加非线性,第二次是稠密测试)改进点:1.小卷积核,2个3*3 等价5*5,3个3*3 等价7*7(感受野的等价)作用:节约参数,3个3*3比1个7*7节省81%参数(49-27)/原创 2020-12-01 13:56:39 · 342 阅读 · 0 评论 -
【论文】Alexnet实现python版本
目录结构data 存储训练/测试数据 test 测试集文件夹 train 训练集文件夹 alexnet-owt-4df8aa71.pth alexnet 预训练数据(网上可以下载) imagenet1000.json 训练数据分类标签 imagenet_classnames.txt 训练数据分类标签 tiger cat.jpg 测试用的随便找的 results 训练结果 src 主程序目录 alexnet_inference.py 用预训练数据进行对猫狗的分类测试.原创 2020-12-01 13:33:30 · 1023 阅读 · 2 评论 -
【经典算法】Candy
背景介绍Canny边缘检是在在1986年提出来的,到今天已经30多年过去了,但Canny算法仍然是图像边缘检测算法中最经典、先进的算法之一。相比Sobel、Prewitt等算子,Canny算法更为优异。Sobel、Prewitt等算子有如下缺点:没有充分利用边缘的梯度方向。 最后得到的二值图,只是简单地利用单阈值进行处理。而Canny算法基于这两点做了改进,提出了:基于边缘梯度方向的非极大值抑制。 双阈值的滞后阈值处理。实现步骤1.滤波平滑,复现代码#coding.原创 2020-11-07 14:37:44 · 901 阅读 · 0 评论 -
【OpenCv】OpenCv+VsStudio环境搭建
前言学习计算机视觉会用到OpenCv,在看网上的安装步骤时候,时有不详细使我误解,导致安装失败,实际上安装c++版本OpenCV是十分简单的。大致分为三步。1.下载opencv下载opencv下载完成后即是一个压缩包,解压到想要放置的目录。比如C:\opencv\visualstudio下载VisualStudio IDE 如果你是学生,用邮箱注册账号,登录即可免费使用。2.配置添加Opencv目录至环境变量目录下Path变量中配置IDE 新建空项目 视图-&原创 2020-10-21 15:16:58 · 291 阅读 · 0 评论 -
【OpenCV】harris算法角点检测
角点引入如图所示,从图像的灰度级考虑,A,B为平面无论沿任何方向灰度级都不会发生过大的变化。C,D沿某一方向会发生巨大变化。E,F沿着任何方向都发生巨大变化。结论其中,,当R》》0时,为角点,当R0时,为边界,当R《0时,平坦区。推导本质上是根据图像滑动前后灰度的变化进行判断,所以是一个减法:其中,是窗口当前的坐标为当前的灰度值,为进行微小移动后的灰度值。是窗口的权重项。基于泰勒展开,对图像在平移后进行一阶近似:其中,是的偏导数近似可得原创 2020-10-16 17:36:32 · 454 阅读 · 0 评论 -
【论文】AlexNet 一
1.研究成果AlexNet在ILSVRC-2012以超出第二名10.9个百分点夺冠2.研究意义拉开卷积神经网络统治计算机是觉得许墨 加速计算机视觉应用落地 3.摘要内容在ILSVRC-2010的120万张图片上训练深度卷积神经网络,获得最优结果,top-1和top-5error分别为 37.5%, 17% 该网络(AlexNet)由5个卷积层和3个全连接层构成,共计6000万参数,65万个神经元 为加快训练,采用非饱和激活函数——ReLU,采用GPU训练 为减轻过拟合,采用D原创 2020-11-18 20:03:40 · 395 阅读 · 0 评论