计算机视觉
文章平均质量分 79
主流计算机视觉相关技术,包括图像识别,目标检测,目标跟踪,目标定位,图像分割,实例分割等内容
优惠券已抵扣
余额抵扣
还需支付
¥39.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
Zhang_P_Y
关注机器学习、计算机视觉、嵌入式(MCU、DSP、ARM)和桌面开发等领域
展开
-
【计算机视觉】关于`partial cross entropy loss`用于弱监督语义分割中的说明
【计算机视觉】关于partial cross entropy loss用于弱监督语义分割中的说明弱监督标签以两类别语义分割为例,背景和前景,给定的弱监督标签是只对前景个一小部分进行了标注。这个只是直接拿这个弱监督标签进行训练,会有一定的问题,因为大部分的前景标签都没有标注出来,所以前景类别会受到较大的抑制。GT标签:Weak标签:采用 partial cross entropy loss...原创 2020-04-12 13:42:53 · 1007 阅读 · 0 评论 -
【计算机视觉】评估语义分割精确度的指标
【计算机视觉】评估语义分割精确度的指标假设共有k+1k+1k+1个类(从L0L_0L0到LkL_kLk,其中包含一个空类或背景),pijp_{ij}pij表示本属于类iii但被预测为类jjj的像素数量。即,piip_{ii}pii表示真正的数量,而pijp_{ij}pij pjjp_{jj}pjj则分别被解释为假正和假负,尽管两者都是假正与假负之和。像素精度(Pixel Accu...原创 2020-04-09 20:24:51 · 909 阅读 · 0 评论 -
【深度学习技术】小样本医学影像的深度学习关键技术之深度模型的可解释性
【深度学习技术】小样本医学影像的深度学习关键技术之深度模型的可解释性深度模型的可解释性对于深度模型在医学影像上的应用十分重要。训练好的一个分类模型,怎样才能帮助到医生,其中可解释性是一种尝试。下图为在MURA数据集上训练的模型采用CAM对其最后层卷积输出进行可视化结果。详细工程:https://pengyizhang.github.io/2020/03/25/MIASSL-explanation...原创 2020-03-25 15:02:55 · 2201 阅读 · 0 评论 -
【计算机视觉】 滤波器
【计算机视觉】 滤波器卷积,信号系统中的连续与离散卷积,还有图像处理中的卷积核,卷积神经网络等概念。对于图像处理中来讲,卷积就是卷积核来对图像进行空域滤波。有以下主要内容:输出图像的每一个像素都是卷积核扫描过输入图像得到的加权平均; 权重保持一致; 窗口在像素正中。详细内容:https://pengyizhang.github.io/2020/03/16/filters/...原创 2020-03-16 17:34:00 · 602 阅读 · 0 评论 -
【计算机视觉】Canny算子边缘检测
[计算机视觉] Canny算子边缘检测##1. Canny边缘检测基本原理(1)图象边缘检测必须满足两个条件:一能有效地抑制噪声;二必须尽量精确确定边缘的位置。(2)根据对信噪比与定位乘积进行测度,得到最优化逼近算子。这就是Canny边缘检测算子。(3)类似与Marr(LoG)边缘检测方法,也属于先平滑后求导数的方法。##2. Canny边缘检测算法:step1:用高斯滤波器平滑图象;...原创 2020-03-16 17:31:35 · 704 阅读 · 0 评论 -
Survey of single-target visual tracking methods based on online learning 翻译
视觉跟踪在计算机视觉和机器人学领域是一个流行和有挑战的话题。由于多种场景下出现的目标外貌和复杂环境变量的改变,先进的跟踪框架就有必要采用在线学习的原理。本论文简要的介绍了一下关于视觉跟踪的挑战和应用,通过分类集中讨论基于在线学习的现代跟踪方法。我们提供了对每种分类中的代表性方法的详细描述,同时检查它们的优点和缺点。而且,一些最具代表性的算法被实现,来提供定量的参考。最后,我们列出了几个关于视觉跟踪研究的未来发展趋势。翻译 2015-04-11 19:58:49 · 1821 阅读 · 1 评论 -
Adaptive Compressive Tracking via Online Vector Boosting Feature Selection(ACT算法解读)
从2012年张凯华在CVPR上的一篇Compressive Tracking (CT,压缩跟踪)论文开始,CT算法就引起了广泛关注。其主要的特色就是采用了压缩感知的原理,通过稀疏随机投影矩阵将高维度的Harr-like特征压缩到低维度(2-3的稀疏度),然后通过朴素贝叶斯分类器进行分类。最吸引人的就是采用了压缩感知的原理,一个潜在的方向就是通过压缩感知将高维度的特征转变为低维度,同时能够最大限度的保留原始特征的信息,这样就有可能大限度的节省计算量。但是CT算法的主要缺点是随机初始化Harr-like特征值的原创 2015-07-17 11:13:05 · 2162 阅读 · 0 评论 -
图像相似度测量与模板匹配总结
摘要本文主要总结了进行目标跟踪、检测中经常使用到的图像相似度测量和模板匹配方法,并给出了具体的基于OpenCV的代码实现。引言模板匹配是一种在源图像中寻找与图像patch最相似的技术,常常用来进行目标的识别、跟踪与检测。其中最相似肯定是基于某种相似度准则来讲的,也就是需要进行相似度的测量。另外,寻找就需要在图像上进行逐行、逐列的patch窗口扫描,当然也不一定需要逐行逐列的扫描,当几个原创 2015-07-24 12:21:16 · 42227 阅读 · 3 评论 -
Tracking-Learning-Detection (TLD算法总结)
一、TLD算法简介TLD(Tracking-Learning-Detection)是英国萨里大学的一个捷克籍博士生ZdenekKalal在2012年7月提出的一种新的单目标长时间跟踪算法。该算法与传统跟踪算法的显著区别在于将传统的跟踪算法和传统的检测算法相结合来解决被跟踪目标在被跟踪过程中发生的形变、部分遮挡等问题。同时,通过一种改进的在线学习机制不断更新跟踪模块的“显著特征点”和检测模块原创 2015-07-15 20:22:54 · 6450 阅读 · 0 评论 -
颜色空间总结
颜色空间总结RGB、HSV、YUV什么是颜色Wiki是这样说的:颜色或色彩是通过眼、脑和我们的生活经验所产生的一种对光的视觉效应。嗯,简单点说,颜色就是人对光的一种感觉,由大脑产生的一种感觉。感觉是一个很主观的东西,你怎么确定你看到的红色和我看到的是一样的呢?这个视频解释的很不错。我们需要先假设正常人对于同一种光产生的感觉基本是一致的,讨论才能继续下去。人的视网膜上布满了感光细胞,当有光线传入人眼时原创 2015-09-09 16:05:02 · 26471 阅读 · 1 评论 -
【计算机视觉】Opencv中的Face Detection using Haar Cascades
【计算机视觉】Opencv中的Face Detection using Haar Cascades标签(空格分隔): 【图像处理】声明:引用请注明出处http://blog.csdn.net/lg1259156776/五种典型的haar-like特征,为何能用来检测人脸,人眼呢? 它给出的一个经验之谈是 1. the region of the eyes is often darker than原创 2015-11-06 09:25:17 · 4044 阅读 · 0 评论 -
Haar-like特征来龙去脉
Haar-like特征来龙去脉声明:引用请注明出处http://blog.csdn.net/lg1259156776/ haar-like特征概念haar-like特征是是计算机视觉领域一种常用的特征描述算子。它最早是由Papageorigiou等人用于人脸描述。目前常用的Haar-like特征可以分为三类:线性特征、边缘特征、点特征(中心特征)、对角线特征。如下图所示 Haar特征(Haar-原创 2015-09-23 11:20:55 · 13587 阅读 · 0 评论 -
【计算机视觉】opencv读取多个摄像头
【计算机视觉】opencv读取多个摄像头标签(空格分隔): 【图像处理】说明:今天蹭了机器视觉课程,讲到了stereopsis,立体视觉,讲到了关于通过多个摄像头获取object的depth信息的事情,因为想到从来没有试过打开多个摄像头进行过处理,这次进行了测试,这里小小记录一下。opencv提供的VideoCapture可以很方便的打开视频、摄像头设备,而且直接输入对应的摄像头标号即可,或者视频的原创 2015-11-12 20:45:24 · 8870 阅读 · 2 评论 -
【计算机视觉】反向投影直方图检测特定的图像内容
【计算机视觉】反向投影直方图检测特定的图像内容标签(空格分隔): 【图像处理】原理:获取特定的图像内容直方图,并进行归一化,然后将输入图像的某一位置上像素值(多维或灰度)对应在直方图的一个bin上的值来代替该像素值,所以得到的反向投影图是单通的。举个小例例如灰度图像如下Image=0 1 2 3 4 5 6 7 8 9 10 11原创 2015-11-14 19:38:39 · 1990 阅读 · 0 评论 -
关于opencv的几个小总结
关于opencv的几个小总结说明:opencv是一个非常好用的开源图像处理与计算机视觉支持库,但是在实际使用中经常会遇到各种费解的问题,这里将遇到的一些问题进行汇总,以便参考。原创 2015-10-13 21:01:41 · 2592 阅读 · 0 评论 -
【计算机视觉】特征脸EigenFace与PCA
【计算机视觉】特征脸EigenFace与PCA标签(空格分隔): 【图像处理】 版权声明:本文为博主原创文章,转载请注明出处http://blog.csdn.net/lg1259156776/。说明:本文主要想弄清楚将人脸识别推向真正可用的第一种方法:特征脸方法。【这里采用的是1维的PCA方法,将图像转变为行向量或者列向量,虽然破坏了几何结构,但是处理比较直观方便】第一步是构建样本集合获取包含原创 2015-11-27 16:56:30 · 5032 阅读 · 0 评论 -
【计算机视觉】形态学滤波
【计算机视觉】形态学滤波标签(空格分隔): 【图像处理】 【信号处理】版权声明:本文为博主原创文章,转载请注明出处http://blog.csdn.net/lg1259156776/。说明:本文主要想弄清楚形态学滤波在图象处理和信号处理中的应用,图像处理中非常直观的通过腐蚀膨胀获得开闭运算的效果,而在数据实时滤波中,形态学滤波也是可以使用的。形态学滤波基本知识 原理:在特殊领域运算形式——结构元原创 2015-11-28 16:30:59 · 18831 阅读 · 4 评论 -
【计算机视觉】目标检测与跟踪简介1
运动目标跟踪在军事制导,视觉导航,机器人,智能交通,公共安全等领域有着广泛的应用。例如,在车辆违章抓拍系统中,车辆的跟踪就是必不可少的。在入侵检测中,人、动物、车辆等大型运动目标的检测与跟踪也是整个系统运行的关键所在。所以,在计算机视觉领域目标跟踪是一个很重要的分支。 运动目标检测是运动目标跟踪的前提;运动目标检测,依据目标与摄像机之间的关系可以分为静态背景下的运动转载 2016-03-01 22:12:37 · 4634 阅读 · 0 评论 -
2013计算机视觉代码合集二
申明,本文非笔者原创,本文转载自:http://www.yuanyong.org/blog/cv/resource-codeFeature Detection and DescriptionGeneral Libraries: VLFeat – Implementation of various feature descriptors (includ转载 2016-03-02 09:04:11 · 799 阅读 · 0 评论 -
2013计算机视觉代码合集一
申明:本文非笔者原创,原文转载自:http://www.yuanyong.org/blog/cv/cv-code一、特征提取Feature Extraction:SIFT [1] [Demo program][SIFT Library] [VLFeat]PCA-SIFT [2] [Project]Affine-SIFT [3] [Project]SURF转载 2016-03-02 09:05:50 · 949 阅读 · 0 评论 -
Official Program for CVPR 2015
From: http://www.pamitc.org/cvpr15/program.php Official Program for CVPR 2015Monday, June 88:30am-8:40amBallrooms A,B,CRooms 302,304,306Opening Remarks from Conference C转载 2016-03-02 09:46:37 · 4328 阅读 · 0 评论 -
cvpr2015papers
@http://www-cs-faculty.stanford.edu/people/karpathy/cvpr2015papers/CVPR 2015 papers(in nicer format than this)maintained by @karpathyNEW: This year I also embedded the (1,2-gram) tfidf转载 2016-03-02 09:50:40 · 8878 阅读 · 0 评论 -
CVPapers - Computer Vision Resource
To add links (PDF, project,...) you can use the online tool.Computer Vision Paper IndexesICCV: 2015, 2013, 2011,2009, 2007CVPR: 2015 available on CVPR website, 2014, 2013,2012, 2011, 2010, 2009转载 2016-03-02 12:10:30 · 828 阅读 · 0 评论 -
【计算机视觉】计算机视觉/图像/模式识别方向期刊会议
第一章:会议 conferences一般来说,学术会议会设置很多chairs,各种chairs职责不同。General chairs是负责组织会议的准备和进行的,program chairs负责接收paper并确定paper的领域。各个领域会有area chairs,负责将每篇paper分发给不同的reviewer。Reviewer不属于会议的领导层。会议的审稿分为双盲,单盲和全透明。双盲就是转载 2016-03-08 18:33:58 · 2120 阅读 · 0 评论 -
【计算机视觉】TPAMI的Editors
写了一篇文章准备试试TPAMI,没指望中,就当听听意见也好,让选两个Editors (2 preferred editors required),于是调研了一下这些人都是做什么的,有同行路过请评价补充,以资后辈Astrom, Kallehttp://journalogy.net/Author/194614/kalle-astromAvidan, Shaihttp://www.e转载 2016-03-09 20:29:09 · 1478 阅读 · 0 评论 -
【计算机视觉】期刊整理
期刊名是不是SCI核心影响因子(2006年)投稿网址Computer vision and image understanding是1.548http://ees.elsevier.com/cviu/Image and Vision Computing是1.171转载 2016-03-09 20:30:26 · 916 阅读 · 0 评论 -
【计算机视觉】图像处理与计算机视觉基础,经典以及最近发展
在这里,我特别声明:本文章的源作者是 杨晓冬 (个人邮箱:xdyang.ustc@gmail.com)。原文的链接是http://www.iask.sina.com.cn/u/2252291285/ish。版权归 杨晓冬 朋友所有。 我非常感谢原作者辛勤地编写本文章,并愿意共享出来。我也希望转载本文的各位朋友,要注明原作者和出处,以尊重原作者!转载 2016-03-14 12:12:45 · 2785 阅读 · 0 评论 -
【计算机视觉】行人检测(Pedestrian Detection)资源
一、论文综述类的文章[1]P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the state of the art [J].IEEE Transactions on PatternAnalysis andMachine Intelligence, 2012, 34(4): 74转载 2016-03-14 12:17:34 · 2640 阅读 · 0 评论 -
【计算机视觉】极限优化:Haar特征的另一种的快速计算方法—boxfilter
这种以Boxfilter替代integral image 的方法很难使用到haar、LBP等特征检测中,因为像下面说的,它不支持多尺度,也就是说所提取的特征必须是同一个大小,最起码同一个宽高比的,这一点对宽高不定的haar特征、LBP特征都有很大的限制,但对于HOG特征因为尺度不像另外两个那样灵活,还是有迹可循的。采长补短申明:以下非笔者原创,原文转载自:http://www.转载 2016-03-14 12:19:55 · 1502 阅读 · 0 评论 -
【计算机视觉】Histogram of Oriented Gridients(HOG) 方向梯度直方图
Histogram of Oriented Gridients(HOG) 方向梯度直方图Histogram of Oriented Gridients,缩写为HOG,是目前计算机视觉、模式识别领域很常用的一种描述图像局部纹理的特征。这个特征名字起的也很直白,就是说先计算图片某一区域中不同方向上梯度的值,然后进行累积,得到直方图,这个直方图呢,就可以代表这块区域了,也就是作为转载 2016-03-14 22:12:45 · 1321 阅读 · 0 评论 -
【计算机视觉】time of flight (TOF)
目录(?)[-]11 TOF初探12 TOF研究机构13 TOF之应用领域14 TOF相机特点2 深度相机比较1 MESA系列介绍2 PMD Tec系列3 NATAL4 primeSense1.1 TOF初探TOF是Time of flight的简写,直译为飞行时间的意思。所谓飞行时间法3D成像,是通过给目标连续发送光脉冲,然后用传感器接收从物体返回转载 2016-04-08 21:52:38 · 9496 阅读 · 1 评论 -
【图像处理】引导滤波器
1,定义引导滤波:即需要引导图的滤波器,引导图可以是单独的图像或者是输入图像,当引导图为输入图像时,引导滤波就成为一个保持边缘的滤波操作,可以用于图像重建的滤波。引导滤波的流程见下图:假设输入图像为p,输出图像为q,引导图为I,q与I在以像素k为中心的窗口中存在局部线性关系:窗口半径为r,a,b为线性系数,且在局部窗口k中为常数。这个转载 2016-07-03 16:49:15 · 16212 阅读 · 2 评论 -
【图像处理】加权最小二乘滤波器
目录(?)[-]引言算法关于拉普拉斯矩阵参考资料转载请保留以下信息引言陆陆续续在计算摄影学接触了不少保边滤波器,其重要性自不必说,可以用在图像的增强,图像抽象画,高动态范围图像压缩,图像色调映射等。 今天介绍的WLS(最小二乘滤波器)即使其中一种,论文全称《Edge-Preserving Decompositions for Multi-Scale转载 2016-07-03 16:50:58 · 4396 阅读 · 1 评论 -
【VS开发】【图像处理】双边滤波器bilateral filter
目录(?)[-]简介原理代码实现1 Spatial Weight2 Similarity Weight3 Color Filtering在SSAO中的使用1. 简介图像平滑是一个重要的操作,而且有多种成熟的算法。这里主要简单介绍一下Bilateral方法(双边滤波),这主要是由于前段时间做了SSAO,需要用bilateral blur 算法进行降噪。Bi转载 2016-07-02 15:46:26 · 3254 阅读 · 0 评论 -
【图像处理】三种边缘保持的滤波器(双边,引导,加权最小二乘)
从原理上分析,这几种滤波器没有太大的差别,都是基于最基本的思想:在梯度比较大的地方(edges)实现preserve,要求尽量不进行平滑,最好是输出与输入一样;而在梯度比较小的地方,尽量的平滑一下,输入与输出可以有稍大的不同!那么从这个原理出发,我们来推导双边滤波和引导滤波: 对于双边滤波的话,将spatial kernel(也就是gaussian kernel)与range kernel(也就是原创 2016-07-03 20:55:39 · 16354 阅读 · 0 评论 -
【计算机视觉】计算机视觉领域资料收集
目录(?)[+]通用库General Library图像视频IOImage Video IOAR相关Augmented Reality局部不变特征Local Invariant Feature目标检测Object Detection近似最近邻ANNSLAM SFM图像分割Segmentation目标跟踪Tracking直线检测Li转载 2016-07-20 15:46:32 · 6541 阅读 · 0 评论 -
【计算机视觉】<前景检测>背景建模数学理论
转自:http://underthehood.blog.51cto.com/2531780/484191背景建模算法1 基本原理视频图像中运动目标检测的一种方法,其基本思想是对图像的背景进行建模。一旦背景模型建立,将当前的图像与背景模型进行某种比较,根据比较结果确定前景目标(需要检测的运动目标)。2 难点(1) 环境光照的变化(光照突然性转载 2016-09-11 16:38:10 · 3814 阅读 · 0 评论 -
【计算机视觉】<前景检测>常用背景模型介绍
转自:http://www.cnblogs.com/xrwang/archive/2010/02/21/ForegroundDetection.html作者:王先荣前言 在很多情况下,我们需要从一段视频或者一系列图片中找到感兴趣的目标,比如说当人进入已经打烊的超市时发出警报。为了达到这个目的,我们首先需要“学习”背景模型,然后将背景模型和当前图像进行比较,从而得到前景转载 2016-09-11 16:42:33 · 2225 阅读 · 0 评论 -
【计算机视觉】<前景检测>非参数背景模型介绍<一>
转自:http://www.cnblogs.com/xrwang/archive/2010/03/27/BackgroundGenerationAndForegroundDetectionPhase2.html作者:王先荣 本文尝试对《学习OpenCV》中推荐的论文《Nonparametric Background Generation》进行翻译。由于我的英文水平很差转载 2016-09-11 16:44:13 · 3118 阅读 · 0 评论 -
【计算机视觉】<前景检测>非参数背景模型介绍<二>
转自:http://www.cnblogs.com/xrwang/archive/2010/04/12/BackgroundGenerationAndForegroundDetectionPhase3.html作者:王先荣 在上一篇文章里,我尝试翻译了《Nonparametric Background Generation》,本文主要介绍以下内容:如何实现该论文的算法,如果利转载 2016-09-11 16:54:11 · 1056 阅读 · 0 评论