目标检测
lbaihao
zephyr,data structure, algorithm, protocol,darknet,architecture
展开
-
目标检测-Top-N 指标计算方法
一、图像分类性能评估指标(概念介绍)Top-1 & Top5: 这两个标准主要用于图像分类任务中Top-1 error rate: 对一张图片,若概率最大的是正确答案,则认为分类正确,否则错误;用 argmax 从网络输出取到的预测 index 与真实 index 的准确率。Top-5 error rate: 对一张图片,若概率前五的预测中包含正确答案,则认为分类正确,否则错误;二、问题分析1. 针对 Top-1 的准确率: 直接通过 argmax 就可以了import原创 2022-04-25 21:21:04 · 571 阅读 · 0 评论 -
目标检测 — 基本概念
一、识别、定位、检测和分割1.1 识别和定位:针对单个目标的任务,识别就是给定一张图片,要让计算机告诉你图片中是什么。而定位任务不仅要识别出图像中是什么,还要给出目标在图像中的位置信息。简单的说,就是用一个矩形框把识别的目标框出来(有时候也有多个固定数量的目标)。而我们通常采用两种方式在图像中表示一个矩形框:(x1, y1, x2, y2): 即给出矩形框左上角和右下角的坐标(x1, y1, w, h):即给出矩形框的左上角坐标和矩形框的长宽。总的的来说,不管用哪种方法表示,我们都至少需要 4 个原创 2022-04-25 20:21:20 · 693 阅读 · 0 评论 -
YOLOV1原理
问题背景:“end-to-end方法的典型代表就是有名的yolo。前面的方法中,CNN本质的作用还是用来分类,定位的功能其并没有做到。而yolo这种方法就是只通过CNN网络,就能够实现目标的定位和识别。” 这是在知乎上看到的一句话。我突然像看看YOLO的厉害之处在哪?所以写这篇博文。本文参考链接: https://zhuanlan.zhihu.com/p/25236464文中标蓝部分为暂未弄清楚的...转载 2018-07-13 15:41:17 · 2362 阅读 · 0 评论 -
YOLO背景介绍
一、背景介绍YOLO(You Only Look Once: Unified, Real-Time Object Detection),是Joseph Redmon和Ali Farhadi等人于2015年提出的基于单个神经网络的目标检测系统。在2017年CVPR上,Joseph Redmon和Ali Farhadi又发表的YOLO 2,进一步提高了检测的精度和速度。本博仅学习YOLO!// 论文下...原创 2018-07-13 15:13:24 · 8694 阅读 · 0 评论 -
ChaLearn Gesture Challenge_1:CGD数据库简单介绍
ChaLearn Gesture Challenge挑战赛是手势识别中比较新的(2011年开始的)一个挑战赛,属于机器学习挑战赛中的一个,其初衷是进行One-Shot learning的挑战,当然也不局限在此。官网为:http://gesture.chalearn.org/ ,2012年分别主办了两轮比赛,一个是在CVPR2012中进行,另一个是在ICPR2012中进行。关于本次比赛的一些规转载 2017-11-15 11:07:42 · 760 阅读 · 0 评论 -
opencv源码解析之(6):hog源码分析
opencv源码解析之(6):hog源码分析 一、网上一些参考资料 在博客目标检测学习_1(用opencv自带hog实现行人检测) 中已经使用了opencv自带的函数detectMultiScale()实现了对行人的检测,当然了,该算法采用的是hog算法,那么hog算法是怎样实现的呢?这一节就来简单分析一下opencv中自带 hog源码。转载 2017-11-14 19:02:18 · 362 阅读 · 0 评论 -
Histogram of Oriented Gridients(HOG) 方向梯度直方图
Histogram of Oriented Gridients,缩写为HOG,是目前计算机视觉、模式识别领域很常用的一种描述图像局部纹理的特征。这个特征名字起的也很直白,就是说先计算图片某一区域中不同方向上梯度的值,然后进行累积,得到直方图,这个直方图呢,就可以代表这块区域了,也就是作为特征,可以输入到分类器里面了。那么,接下来介绍一下HOG的具体原理和计算方法,以及一些引申。 1转载 2017-11-14 18:57:49 · 201 阅读 · 0 评论 -
目标检测的图像特征提取之(一)HOG特征
1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Dal转载 2017-11-14 18:44:25 · 199 阅读 · 0 评论 -
DPM(Deformable Parts Models)-----目标检测算法理解
DPM(Deformable Parts Models)翻译成中文是可变型部件模型,是一种用于目标探测的方法。首先说一下什么是目标探测。目标探测概念:我的理解,目标探测就是输入一幅图像,输出该图像中包含的物件以及该物件的位置,或者输入一幅图像,探测该图像中是否有目标物件。所以,总得来说目标探测需要完成两大目标,一是寻找物件的位置,二是识别该物件。目标探测的任务是实现单个转载 2017-11-13 11:36:48 · 1386 阅读 · 0 评论 -
OpenCV中直方图反向投影算法详解与实现
OpenCV中直方图反向投影算法详解与实现一:直方图交叉OpenCV中直方图反向投影算法实现来自一篇论文《Indexing Via Color Histograms》其作者有两位、是Michael.J.Swain与Dana H. Ballard。论文分为两个部分,前面一部分详细描述了颜色直方图以及通过颜色直方图交叉来实现对象鉴别。可以实现对象背景区分、复杂场景中查找对象、不同光照条转载 2017-06-14 21:12:48 · 965 阅读 · 0 评论 -
Ubuntu 12.04安装最新版VLC2.0.2
最新版VLC2.0.2改进高清播放支持,字幕检测和Qt界面调整。Ubuntu 12.04下安装VLC2.0.2:sudo add-apt-repository ppa:videolan/stable-daily sudo apt-get update sudo apt-get install vlc 播放使用命令行 vlc test.mp4(注意不要原创 2016-11-12 23:49:57 · 458 阅读 · 0 评论 -
linux camera isp
名词解释: 【edr】边缘增强处理算法一般调整YCbCr空间的Y值不会 明显影响到图像的色彩,也就不会出现色彩失衡的情况。【saturation】饱和度增强处理的主要作用是使图像色彩更加丰富,通常是通过对颜色分量 Cb和Cr各乘上一个增益值完成彩色饱和度增强。自动曝光控制通过调节CIS中像素单元的曝光时间和前端模拟 电路中数字可编程增益放大器的增益而使图像亮度达到用户自定义原创 2016-11-10 23:19:58 · 2741 阅读 · 1 评论 -
媒体播放器三大底层架构
媒体播放工具,这里主要指视频播放,因为要面临庞大的兼容性和纷繁复杂的算法,从架构上看,能脱颖而出的体系屈指可数。大体来说业界主要有3大架构:MPC、MPlayer和VLC。这3大架构及其衍生品占领了90%的市场,凡是用户能看到的免费媒体播放软件,无一不是源自这3大架构。 MPC-HC架构 MPC(Media Player Classic)和它的后续者MPC-HC应该并列而说。原创 2016-08-11 22:34:22 · 918 阅读 · 0 评论 -
[总结]FFMPEG视音频编解码零基础学习方法
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的“大神”,有的是刚开始学习的初学者。在和大家探讨的过程中,我忽然发现了一个问题:在“大神”和初学者之间好像有一个不可逾越的鸿沟。“大神”们水平高超,探讨着深奥的问题;而初学者们还停留在入门阶段。究竟是什么原因造成的这种“两极分化”呢?最后,我发现了问题的关键:FFMPEG难度比较大,转载 2016-08-05 23:36:13 · 1131 阅读 · 0 评论 -
[总结]视音频编解码技术零基础学习方法
一直想把视音频编解码技术做一个简单的总结,可是苦于时间不充裕,一直没能完成。今天有着很大的空闲,终于可以总结一个有关视音频技术的入门教程,可以方便更多的人学习从零开始学习视音频技术。需要注意的是,本文所说的视音频技术,指的是理论层面的视音频技术,并不涉及到编程相关的东西。 0. 生活中的视音频技术平时我们打开电脑中自己存电影的目录的话,一般都会如下图所示,一大堆五花八门的电转载 2016-08-05 20:09:57 · 887 阅读 · 0 评论 -
MIPI CSI-2规范(一)——概述及层级
CSI-2概述 CSI-2规范定义了发送者和接收者之间传输和控制接口的标准数据。数据传输接口(指CSI-2)是单向差分串行接口,传输数据和时钟信号;接口的物理层说明文档参见《MIPIAlliance Specification for D-PHY》[MIPI01]。图1描述了CSI-2发送者和接收者之间的连接关系,是一个典型的摄像头模型和接收者模型(移动电话的一部分)连接关系。(译者:围原创 2016-06-17 21:14:48 · 3883 阅读 · 0 评论 -
图文详解YUV420数据格式
YUV格式有两大类:planar和packed。对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V。对于packed的YUV格式,每个像素点的Y,U,V是连续交*存储的。 YUV,分为三个分量,“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V” 表示的则是色度(Chrominance或Chro原创 2016-06-08 21:39:31 · 532 阅读 · 0 评论