
图像/视频
文章平均质量分 90
chenbang110
学习是最快乐的事
展开
-
LibSVM学习(一)——初识LibSVM
LibSVM是台湾 林智仁(Chih-Jen Lin) 教授2001年开发的一套支持向量机的库,这套库运算速度还是挺快的,可以很方便的对数据做分类或回归。由于libSVM程序小,运用灵活,输入参数少,并且是开源的,易于扩展,因此成为目前国内应用最多的SVM的库。 这套库可以从http://www.csie.ntu.edu.tw/~cjlin/免费获得,目前已经发展到2.转载 2012-05-04 18:11:49 · 940 阅读 · 0 评论 -
如何看懂摄橡机技术指标
http://blog.solocat.com/2008/05/17/%e7%9b%91%e6%8e%a7%e6%91%84%e5%83%8f%e6%9c%ba%e5%a4%a7%e5%85%a8/comment-page-1/#comment-114 在摄像机这个圈子,一张彩页里的技术指标其实就已经涵盖了大部份的技术,不信,有几个人敢说他完全知道的,不管是销售人员或工程商,最先拿转载 2013-04-24 11:32:53 · 11973 阅读 · 0 评论 -
CCD原理结构图
原创 2013-08-12 00:56:00 · 4388 阅读 · 0 评论 -
视频编解码学习之一:理论基础
第1章介绍1. 为什么要进行视频压缩?未经压缩的数字视频的数据量巨大存储困难一张DVD只能存储几秒钟的未压缩数字视频。传输困难1兆的带宽传输一秒的数字电视视频需要大约4分钟。2. 为什么可以压缩去除冗余信息空间冗余:图像相邻像素之间有较强的相关性时间冗余:视频序列的相邻图像之间内容相似编码冗余:不同像素值出现的概率转载 2013-08-25 23:51:44 · 961 阅读 · 0 评论 -
CV界的明星人物们(转载加补充)
http://www.bfcat.com/index.php/2013/07/cv-star/今天在cvchina论坛上看到的一篇帖子,总结了当前CV界最火的一些人。列举的比较全面了。bfcat还想补充几个,加在后面了。CV人物1:Jianbo Shi史建波毕业于UC Berkeley,导师是Jitendra Malik。其最有影响力的研究成果:图像分割。其于2000年在PAM转载 2013-08-13 16:41:09 · 2237 阅读 · 0 评论 -
网络摄象机常用传输协议
多播路由是一个很好的技术,在Internet上实现了对数据的“广播”,不同于广播的是,由于广播风暴的问题,路由器是禁止广播数据跨路由传送的。而多播则很好的解决了这个问题。现在M$软件如:Netmeeting,WMS就广泛运用了多播这种技术。这里讨论的是怎么样把你的Linux架设成一个多播路由器 (一般的网关、路由器是不支持多播数据包通过的)。1、传输协议 网络摄像机提转载 2013-10-06 21:09:38 · 1215 阅读 · 0 评论 -
RTSP详解
RTSP简介 RTSP(Real Time Streaming Protocol)是由Real Network和Netscape共同提出的如何有效地在IP网络上传输流媒体数据的应用层协议。RTSP对流媒体提供了诸如暂停,快进等控制,而它本身并不传输数据,RTSP的作用相当于流媒体服务器的远程控制。服务器端可以自行选择使用TCP或UDP来传送串流内容,它的语法和运作跟HTTP 1.1类转载 2013-10-29 11:23:06 · 3185 阅读 · 0 评论 -
视频会议十大开源项目排行
在视频会议领域,有许多可以值得参考的开源项目,这些开源项目有的是协议栈、有的是编码器或者是传输协议,由于视频会议系统是一个综合性的应用系统,里面包含功能较多,如能把这些开源项目选择性的加入我们的视频会议开发当中,我们的开发效率肯定会事半功倍,下面我们列举一下视频会议相关的十大开源项目,并对其重要性及优缺点做一个全面的评价与排名。1、 OpenH323项目 (★★★★★)转载 2013-10-30 19:45:24 · 38441 阅读 · 4 评论 -
图文详解YUV420数据格式
YUV格式有两大类:planar和packed。对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V。对于packed的YUV格式,每个像素点的Y,U,V是连续交*存储的。 YUV,分为三个分量,“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V” 表示的则是色度(Chrominance或Chro转载 2013-11-10 08:47:36 · 963 阅读 · 0 评论 -
什么是I帧,P帧,B帧
http://blog.csdn.net/abcjennifer/article/details/6577934视频压缩中,每帧代表一幅静止的图像。而在实际压缩时,会采取各种算法减少数据的容量,其中IPB就是最常见的。 简单地说,I帧是关键帧,属于帧内压缩。就是和AVI的压缩是一样的。 P是向前搜索的意思。B是双向搜索。他们都是基于I帧来压缩数据。转载 2013-12-30 20:01:19 · 1038 阅读 · 0 评论 -
视频与图像RGB/YUV格式详解
http://blog.chinaunix.net/uid-9012903-id-3062734.html根据三基色原理,任意一种色光F都可以用不同分量的R、G、B三色相加混合而成。F = r [ R ] + g [ G ] + b [ B ] 其中,r、g、b分别为三基色参与混合的系数。当三基色分量都为0(最弱)时混合为黑色光;而当三基色分量都为k(最强)时混合为白转载 2013-03-27 21:04:33 · 1149 阅读 · 0 评论 -
不同视频格式
D1:480i格式,和NTSC模拟电视清晰度相同,行频为15.25kHzD2:480P格式,和逐行扫描DVD规格相同,行频为31.5kHzD3:1080i格式,分辨率为1920×1080i/60Hz,行频为33.75kHzD4:720p格式,分辨率为1280×720p/60Hz,行频为45kHzD5:1080p格式,分辨率为1920×1080逐行扫描,专业格式转载 2013-04-09 18:53:44 · 819 阅读 · 0 评论 -
YUV ,RGB,H.264,MPEG-4,QVGA,VGA,CIF
关于视频的这些概念(包括电视制式、格式、接口等等),在《动态影像与宽带流媒体应用》 (李海燕 丛培岩著) 一书中有比较详细的解释。1、RGB 这个大部分都知道,“人类眼睛的色觉,具有特殊的特性,早在上世纪初,Young(1809)和Helmholtz(1824)就提出了视觉的三原色学说,即:视网膜存在三种视锥细胞,分别含有对红、绿、蓝三种光线敏感的视色素,当一定波长的转载 2013-04-06 22:30:59 · 1714 阅读 · 0 评论 -
LibSVM学习(六)——easy.py和grid.py的使用
我们在“LibSVM学习(一)”中,讲到libSVM有一个tools文件夹,里面包含有四个python文件,是用来对参数优选的。其中,常用到的是easy.py和grid.py两个文件。其实,网上也有相应的说明,但很不系统,下面结合本人的经验,对使用方法做个说明。 这两个文件都要用python(可以在http://www.python.org上下载到,需要安装)和绘图工具gnuplo转载 2012-05-04 19:16:41 · 1524 阅读 · 0 评论 -
LibSVM学习(二)——第一次体验libSvm
1. 把LibSVM包解压到相应的目录(因为我只需要里面windows文件夹中的东东,我们也可以只把windows文件夹拷到相应的目录),比如C:\libsvm-3.12 2. 在电脑“开始”的“运行”中输入cmd,进入DOS环境。定位到C:\libsvm-3.12下,具体命令如下: C: (回车) cd C:\libsvm-3.12\w转载 2012-05-04 18:24:34 · 1227 阅读 · 0 评论 -
LibSVM学习(五)——分界线的输出
对于学习SVM人来说,要判断SVM效果,以图形的方式输出的分解线是最直观的。LibSVM自带了一个可视化的程序svm-toy,用来输出类之间的分界线。他是先把样本文件载入,然后进行训练,通过对每个像素点的坐标进行判断,看属于哪一类,就附上那类的颜色,从而使类与类之间形成分割线。我们这一节不讨论svm-toy怎么使用,因为这个是“傻瓜”式的,没什么好讨论的。这一节我们主要探讨怎么结合训练结果文件,自转载 2012-05-04 19:13:02 · 2304 阅读 · 0 评论 -
LibSVM学习(四)——逐步深入LibSVM
其实,在之前上海交大模式分析与机器智能实验室对2.6版本的svm.cpp做了部分注解,(在哪里?google一下你就知道)。但是,这个注释只是针对代码而注释,整篇看下来,你会发现除了理解几个参数的含义,还是会对libsvm一头雾水。当然作为理解程序的辅助材料,还是有很大用处的。特别是,对几个结构体的说明,比较清楚。但是要清楚程序具体做了什么,还是要追踪程序中去。 由于svm涉转载 2012-05-04 19:11:46 · 963 阅读 · 1 评论 -
计算机视觉文献与代码资源及资料
下面是前端时间搜集整理的一些和计算机视觉、模式识别的资源,拿出来与大家分享下。以后,我将把图像处理真正的作为我的兴趣来玩玩了,也许不把研究作为谋生的手段,会更好些。标题作者主题关键字类别来源备注nipsfast.pptNando de Fr转载 2012-04-23 14:49:41 · 1028 阅读 · 0 评论 -
什么是复合视频信号(CVBS)
复合视频接口:复合视频(Composite Video)信号定义为包括亮度和色度的单路模拟信号,也即从全电视信号中分离出伴音后的视频信号,这时的色度信号还是间插在亮度信号的高端。由于复合视频的亮度和色度是间插在一起的,在信号重放时很难恢复完全一致的色彩。这种信号一般可通过电缆输入或输出到家用录像机上,其信号带宽较窄,一般只有水平240线左右的分解率。复合视频信号也称为基带视频信号或RC转载 2012-05-09 09:47:10 · 7030 阅读 · 0 评论 -
常见的视频接口介绍,VGA,YPbPr,DVI,HDMI,DisplayPort
1,VGA(D-SUB)这种是显示器最常见的,用了很多年,色域空间是RGB,也就是红绿蓝,模拟信号,无音频插头是15针的,实际所需的最小针数应该是5针,也就是RGB三色信号,水平同步信号,垂直同步信号(地线另外算)2,YPbPr色差信号 这是电视机最常见的,三根线,红绿蓝,其中绿色的是亮度信号,红色和蓝色是色度信号你只插一根绿色也是能显示转载 2012-05-11 09:42:06 · 16097 阅读 · 0 评论 -
图像的一般格式
摘要:描述了各种图像文件结构,尤其着重讲述了PPM文件格式以及PPM文件的读写。因为最近在使用PPM文件做图像处理,以前并未接触到,所以会特别关注。 一般的图像文件结构主要都包含有文件头、文件体和文件尾等三部分: 文件头:软件ID、软件版本号、图像分辨率、图像尺寸、图像深度、彩色类型、编码方式、压缩算法 文件体:图像数据、彩色变换表 文转载 2012-07-11 14:53:11 · 766 阅读 · 0 评论 -
JPEG图像压缩算法流程详解
JPEG是Joint Photographic Exports Group的英文缩写,中文称之为联合图像专家小组。该小组隶属于ISO国际标准化组织,主要负责定制静态数字图像的编码方法,即所谓的JPEG算法。JPEG专家组开发了两种基本的压缩算法、两种熵编码方法、四种编码模式。如下所示:压缩算法:(1)有损的离散余弦变换DCT(Discrete Cosine Transform)转载 2012-07-17 09:00:02 · 2935 阅读 · 0 评论 -
EDID解析
1 InstructionEDID: Extended Display Identification Data(扩展显示标识数据)是一种VESA (Video Electronics Standards Association)标准数据格式,其中包含有关显示器及其性能的参数,包括供应商信息、最大图像大小、颜色设置、厂商预设置、频率范围的限制以及显示器名和序列号的字符串(摘自百度百科“EDID”词条...转载 2018-03-06 09:41:49 · 18442 阅读 · 2 评论