- 博客(11)
- 资源 (9)
- 收藏
- 关注
原创 霍夫变换(Hough Transform)
霍夫变换是图像处理中的一个检测直线、圆等简单几何形状的方法。它最初是用于在二值化的图像中进行直线检测的。对于图像中的一条直线而言,利用直角坐标系,可以表示为:的形式。那么,该直线上任意一点(x,y)变换到k-b参数空间将变成一个“点”。也就是说,将图像空间中所有的非零像素转换到k-b参数空间,那么它们将聚焦在一个点上。如此一来,参数空间中的一个局部峰值点就很有可能对应着原图像空间中的一
2011-06-26 12:12:00 34226 6
原创 H.264
H.264是一种高性能的视频编解码技术,目前世界上制定视频编解码技术标准的组织有两个:国际电联组织(IUT-T),它制定的标准有H.261,H.262,H.263等。另一个是国际标准化组织(ISO),它制定的标准有MPEG-1,MPEG-2,MPEG-4等。而H.264则是这两个组织联合起来共同制定的一种视频编解码技术。而且它将成为MPEG-4标准的第10部分。因此,不论是MPEG-4 A
2011-06-19 11:12:00 2693 2
原创 MPEG标准
MPEG是Moving Picture Experts Group的简称,其本意指代一个研究音频和视频编码标准的小组,如今,它泛值由该小组指定的一系列视频编码标准。自1998年成立以来,该小组已经相继制订了MPEG-1,MPEG-2,MPEG-3,MPEG-4,MPEG-7等多个标准。MPEG组织,到目前为止,已经指定并正在指定以下视频标准:MPEG-1:第一个官方指定的音视频压缩标准,随
2011-06-19 10:33:00 3639
原创 JPEG格式
JPEG的全称是Joint Photographic Experts Group(联合图像专家小组),它是一种常用的图像存储格式,其文件后缀名一般为“.jpg”或".jpeg"。JPEG格式可以分为标准JPEG、渐进式JPEG和JPEG2000三种格式。标准JPEG:该类型的图片文件,在网络上应用较多,只有图片完全被加载和读取完毕之后,才能看到图片的全貌;它是一种很灵活的图片压缩方
2011-06-18 20:10:00 4377
原创 XVID的前世今生
XVID是一个开源的MPEG-4视频压缩解压算法库。它的发展壮大,还有一段触目惊心的过程。下面,我将为大家展开讲述其中的故事。1998年,微软开发了当时世界上唯一一个能在PC上使用的MPEG-4视频编解码器,它包括MS-MPEGV1,MS-MPEGV2,MS-MPEGV3共三个系列的编解码内核。其中的V1和V2用来制作AVI文件。相对来说,V3的画面质量要比V1和V2好很多。不过,微软却将这一
2011-06-18 19:04:00 5658 3
原创 OpenCV的SVM用法
在OpenCV当中,SVM是作为一个类来定义接口的,其定义略显复杂。不过,如果你对libSVM比较了解,就会发现,OpenCV的SVM接口与libSVM的接口非常接近。下面,我还利用前面介绍libSVM用法时的数据,通过一个简单的例子程序来介绍OpenCV的SVM模块函数的用法。// OpencvSVM.cpp : Defines the entry point for the conso
2011-06-15 22:31:00 30018 3
原创 libSVM应用举例
前面提到,很多人看到libSVM这么多的参数,估计要犯晕了。没关系,我之前把相关的libSVM参数已经讲解了一遍,这里,再给出libSVM的用法。如果你不想花时间去仔细研究libSVM,完全可以参照我的函数来直接调用libSVM完成你的工作。 首先是训练SVM得到模型;假设,有10个训练样本,每个训练样本,有12个特征值,即:每个训练样本的维数是12,也就是说,训练
2011-06-12 11:50:00 16828 27
原创 libSVM介绍(二)
鉴于libSVM中的readme文件有点长,而且,都是采用英文书写,这里,我把其中重要的内容提炼出来,并给出相应的例子来说明其用法,大家可以直接参考我的代码来调用libSVM库。第一部分,利用libSVM自带的简易工具来演示SVM的两类分类过程。(以下内容只是利用libSVM自带的一个简易的工具供大家更好的理解SVM,如果你对SVM已经有了一定的了解,可以直接跳过这部分内容)首
2011-06-12 11:27:00 47017 24
原创 数字图像处理的定义
数字图像处理方法的研究源于两个主要应用领域:(1)为了便于人们分析而对图像信息进行改进;(2)为了使机器具有类似于人类的分析和理解图像的能力而进行的各种分析和研究;一幅图像可以定义为一个二维函数f(x,y),这里,x和y是空间坐标。在任何一个空间坐标(x,y)上的幅值f称为图像在该点的强度或者灰度。当x,y,f为有限的、离散的数值时,称其为图像。简单点说,数字图像是由有限的元素组成的,每一个元
2011-06-08 20:27:00 5665 1
原创 计算机视觉的最高境界-机器人
一直在写计算机视觉方面的博客,估计有人都烦了,从来都没见有啥具体的应用。别着急,今天我还真找到一个,Prof.Gary Bradski(OpenCV开山鼻祖,opencv learning的作者)领导的Willow Garage机器人研究小组,一直在做家庭,生活方面应用的机器人。他们的主页是:http://www.willowgarage.com,目前他们的机器人,已经可以完成一些简单的动作。例如
2011-06-08 19:40:00 4360 2
原创 开源SVM库libSVM介绍
libSVM是台湾大学林智仁教授等研究人员开发的一个用于支持向量机分类,回归分析及分布估计的c/c++开源库。另外,它也可以用于解决多类分类问题。 libSVM最新的版本是2011年4月发布的3.1版。林智仁教授设计开发该SVM库的目的是为了让其它非专业人士可以更加方便快捷的使用SVM这个统计学习工具。libSVM提供了一些简单易用的接口,从而使得用户可以方便的使用,而不必关心其内部复杂的
2011-06-05 17:19:00 14501 4
压缩感知的几个入门文章
2013-10-12
PAMI2012行人检测综述
2012-12-18
TLD算法论文及PPT
2012-11-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人