自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

暂时为空

暂时为空

  • 博客(15)
  • 资源 (47)
  • 收藏
  • 关注

转载 tbr tbn tbc

不是所有参数都能得到的,有的文件没有这些信息,要看解析层而定。楼主都有代码了,查查就知道了。     if(st->codec->codec_type == CODEC_TYPE_VIDEO){         if(st->r_frame_rate.den && st->r_frame_rate.num)             print_fps(av_q2d(st->r_fr

2013-02-26 18:27:07 2772

转载 PAR DAR SAR

做视频开发过程中碰到这么三个概念,查了一下Wiki的解释,现把个人的理解阐述如下:PAR - pixel aspectratio(可以理解为单个像素的宽高比)大多数情况为1:1,就是一个正方形像素,否则为长方形像素。常用的PAR比率(1:1,10:11,40:33, 16:11, 12:11 ).DAR - display aspectratio就是视频播放时,我们看到的图像宽高的比例,缩

2013-02-26 18:11:07 1707

转载 poll函数

poll函数和select函数非常相似,但是函数接口不一样。  int poll(struct pollfd fdarray[], nfds_t nfds, int timeout);  int select(int maxfdp1, fd_set *restrict readfds, fd_set *restrict expectfds, struct timeval * res

2013-02-21 10:17:29 598

转载 poll

Linux中的字符设备驱动中有一个函数unsigned int (*poll)(struct file * fp, struct poll_table_struct * table)此函数在系统调用select内部被使用,作用是把当前的文件指针挂到设备内部定义的等待队列中。这里的参数table可以不考虑,是在select函数实现过程中的一个内部变量。函数具体实现时:

2013-02-20 14:28:33 669

转载 关于setsid() 函数的说明

守护进程(Daemon)是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用 的进 程。 Linux的大多数服务器就是用守护进程实现的。比如,Internet服务器inetd,Web服务器httpd等。同时,守护进程完成许多系统任务。 比如,作业规划进程crond,打印进程lpd等。守护进程的编程本身并不复杂,复杂的是各种版本的

2013-02-20 09:07:31 9035

转载 getenv putenv setenv和unsetenv详解

getenv:定义函数char * getenv(const char *name);表头文件#include 函数说明getenv()用来取得参数name环境变量的内容。参数name为环境变量的名称,如果该变量存在则会返回指向该内容的指针。环境变量的格式为name=value。

2013-02-19 11:33:13 1609 1

转载 sws_getContext的用法

truct SwsContext* sws_getContext(int srcW, int srcH, int srcFormat, int dstW, int dstH, int dstFormat, int flags, SwsFilter *srcFilter, SwsFilter *dstFilter, double *param)Returns an SwsContext to be

2013-02-18 14:21:51 5196 2

转载 live555+ffmpeg如何提取关键帧(I帧,P帧,B帧)

开发流媒体播放器的时候,特别是在windows  mobile,symbian(S60)平台开发时,很可能遇到需要自己开发播放器的情况。S60平台提供了CVideoPlayUtility接口可以实现流媒体播放器,但由于非开源,所以相对于自己开发播放器,很多操作受到限制。live555主要用于网络流接收,ffmpeg则是对接收到的数据进行编码/解码。I帧,P帧,B帧是视频流中三种分类,其

2013-02-18 14:17:43 5835 1

转载 关于ffmpeg如何提取视频的关键帧的问题

用两种方式,一是利用ffmpeg提供的可执行文件进行提取,另外就是用ffmpeg的sdk,进行开发。我下面说一下如何使用ffmpeg sdk进行提取(假设把提取的关键帧保存成bmp,源文件名是sample.mpg):首先获取文件中的视频流:av_register_all();    if(av_open_input_file(&pFormatCtx, filename, NULL,

2013-02-18 14:16:05 9097 2

转载 FFmpeg转码框架解析

本文的参考和借鉴:http://dranger.com/ffmpeg/tutorial01.html(文章在开篇就声明,它有些过时了)。所以本文分析的FFmpeg源码为Version0.8.2我们在网络上看到的“视频”通常都是一种三层数据封装结构:        编码图像和声音形成的裸视频流(如H.264, VP8, 等)和音频流(mp3, AAC等);        用容

2013-02-18 10:25:31 5112 1

转载 影视画面去交错概念与解析

去交错亦称“反交错”(deinterlacing)是将交错式(即隔行扫描)(interlace)影像讯号转换为渐进式(逐行扫描)(progressive)影像讯号的一种方法。  因为装置处理速度以及带宽的限制下,广播电视系统,例如NTSC或是PAL,都是使用交错式讯号取代渐进式讯号。但是现代新型的显示设备例如液晶显示器、等离子显示器、数位投影机或是数位微型反射镜(DLP,数字光处理)等,都

2013-02-17 18:55:34 5464

转载 struct sockaddr、sockaddr_in、sockaddr_un的区别和联系

在linux环境下,结构体struct sockaddr在/usr/include/linux/socket.h中定义,具体如下:typedef unsigned short sa_family_t;struct sockaddr {        sa_family_t     sa_family;    /* address family, AF_xxx       */

2013-02-16 17:31:17 887

转载 ffmpeg教程

概要 电影文件有很多基本的组成部分。首先,文件本身被称为容器Container,容器的类型决定了信息被存放在文件中的位置。AVI和Quicktime就是容器的例子。接着,你有一组流,例如,你经常有的是一个音频流和一个视频流。(一个流只是一种想像出来的词语,用来表示一连串的通过时间来串连的数据元素)。在流中的数据元素被称为帧Frame。每个流是由不同的编码器来编码生成的。编解码器描述了实际的数据

2013-02-05 22:48:45 2324 1

转载 ffmpeg下libavfilter的安装配置以及利用实现添加水印

水印又叫作"watermark"  以前ffmpeg使用-vhook来调用某个库实现水印添加.后来被废弃.现在添加了-vfilters参数调用libavfilter库来添加水印.但是这个库一直到本文发表的时候文档以及安装方法都不是很完善.  首先要先获得libavfilter  因为,直接从ffmpeg的download页面下载的ffmpeg是不能编译出-vfilters参数的.有了-

2013-02-05 21:46:01 3724

转载 用Android NDK编译FFmpeg

Android内置的编解码器实在太少,于是我们需要FFmpeg。Android提供了NDK,为我们使用FFmpeg这种C语言代码提供了方便。不过为了用NDK编译FFmpeg,还真的花费了不少时间,也得到了很多人的帮助,最应该谢谢havlenapetr。我觉得我现在这些方法算是比较简洁的了--下面就尽量詳細的说一下我是怎么在项目中使用FFmpeg的,但是基于我混乱的表达能力,有不明白

2013-02-05 10:42:08 1318

基于分块颜色相关向量的图像检索算法

颜色是一种重要的视觉信息属性,与纹理、形状等其他图像特征相比,颜色特征非常稳定,对于旋转、平移、尺度变化,甚至各种形变都不敏感,表现出相当强的鲁棒性。同时,由于颜色特征的计算相对简单,因此成为现有基于内容的检索系统中应用最广泛的特征。常用的颜色特征组织形式有一阶直方图方法[1]、累计直方图法[2]、颜色矩[2]方法、颜色对直方图法[3,4]、颜色相关向量法(Color Coherence Vector,CCV)[5]以及具有不变性的颜色特征[6]等等,其中直方图是最常用的组织形式。颜色直方图通过计算不同颜色所包含的像素数目来反映颜色的统计特性,通过测量颜色直方图之间的相似性达到图像检索的目的。根据直方图所在的颜色空间的不同,研究者常常使用RGB颜色直方图和HSV颜色直方图。基于直方图的算法归纳起来,是对颜色的统计信息进行描述和度量,既没有反映颜色的位置信息,也没有反映颜色的结构信息,因此在应用上存在着固有的缺陷。而传统的颜色相关向量法虽然可以反映颜色的结构信息,但是其计算量大,并且无法反映位置信息,所以也难以广泛使用。近年来,随着研究的不断深入,许多基于颜色特征的新方法也不断涌现。

2012-08-09

基于聚类的视频镜头分割和关键帧提取

镜头分割是基于内容的视频检索和浏览首先要解决的关键技术O 视频分割为镜头后1下一步的工作就是进行关键帧提取1用以描述镜头的主要内容O 提出了一种改进的基于聚类的镜头分割和关键帧提取算法1在无监督聚类中引入一个参考变量1解决了利用无监督聚类进行镜头分割和关键帧提取时可能产生的帧序不连续或分割错误的问题O 在关键帧提取阶段1将镜头分割为子镜头后1 引入图像熵的概念提取关键帧O 实验结果表明了改进算法在镜头分割和关键帧提取方面的有效性O

2012-08-05

基于内容的视频检索关键技术研究

随着多媒体技术和网络技术的飞速发展,数字视频的获取和传播变得越来越 容易,已经逐渐成为人类信息传播的主要载体之一。在视频信息高度膨胀的今天,随之而来的问题就是对海量视频的高效检索和浏览。传统的视频检索通过对视频以手工的方法添加文字标识符的方式进行检索,这种检索方式工作量巨大、效率很低,而且受主观因素的影响,因此不能满足实际使用的需要。基于内容的视频检索技术借助计算机对视频进行从低层到高层的处理、分析和理解的过程获取其内容并根据内容进行检索,克服了传统的基于文本检索方式的不足,已成为多媒体信息检索领域的研究热点。

2012-08-05

自适应宏块编码算法的研究

过对H.264/AVC宏块编码类型空域相关性的大量实验分析,发现经过率失真优化而确定的宏块编码类型无论是I帧、P帧和B帧,在空间域上都具有极强的相关性。提出了采用区域方差来度量宏块编码类型的空域复杂性,并根据宏块的这些空域复杂性制定出宏块类型预测的准则。依照该预测准则,给出了一种基于宏块类型空域预测的自适应宏块编码快速算法,并在H.264/AVC验证模型JM7。6上实现。大量的实验表明,采用宏块类型空域预测的自适用宏块编码算法,减少了H.264/AVC率失真优化算法的大量无效遍历,在保持图像编 码质量和压缩效率基本不变的情况下,视频图像编码速度提高了4%~33%,在一定程度上克服了H.264/AVc率失真优化算法速度慢的缺陷。

2012-08-05

基于OpenCV 的运动物体跟踪系统的设计与实现

运动物体的跟踪是把运动的物体检测出来, 对目标编号并获取运动轨迹。因此, 运动跟踪系统性能的优劣关键取决于运动前景检测的准确度。文章首先设计了一种有效的基于自动阈值分割的混合模型运动目标检测算法, 然后以此为基础创建了一个独立的前景检测模块, 最后将该模块嵌入到OpenCV 提供的运动跟踪系统框架里, 实现了一个完整的运动跟踪系统。运行结果表明, 该系统具有较好的稳定性、准确性, 满足了运动跟踪系统实时性、鲁棒性的要求。

2012-08-05

故事视频的语义分析与提取

科技的发展使得数字视频潮水般涌入人们的日常生活。视频内容的丰富性和 多样性、以及特征数据特有的时空高维结构,使得如何有效地对海量视频进行表 达、存储和管理,以便人们快速地浏览和检索,成为一个亟待解决的重大课题。 传统的数据管理与检索技术已远不能适应这种急速的变化和需求,因此基于内容 的视频检索(CBvR)应运而生,相关的研究迅速在各国展开。

2012-08-03

基于语义信息提取的新闻视频场景分割方法

随着数字视频的广泛应用,视频数据库系统已成为多媒体领域的一个研究热点。在建立视频数据库的过程中, 视频场景的分割是一个重要而又难以解决的问题。文章从分析新闻视频场景所特有的结构特征入手,提出了一种基于语 义信息提取的新闻视频场景分割新方法,该方法通过对音频流和视频流中的镜头变换、主持人镜头、主题字幕和静音区 间等语义信息的提取和分析来实现新闻视频场景的分割。实验表明,采用该文提出的方法,场景分割正确率可达86.9%, 较好地解决了新闻视频场景分割问题。

2012-08-03

深度解析图像的颜色通道

对于图像的颜色通道进行详细的探讨,尤其是其在印刷业中的应用。

2012-07-31

数字RGB与YCbCr颜色空问转换的精度

视频处理系统中为了提高处理效率,需要将数字RGB信号转换为数字YCbCr信号.文中提出由于芯片内部寄存器精度的原因,会引起原信号三基色之间的串扰问题;为满足视频处理需求,处理芯片中颜色空间转换寄存器至少要使用7个二进制位来表示色空间转换矩阵;为了彻底消除由精度引起的三色串扰问题,则处理芯片中颜色空间转换寄存器至少要使用9个二进制位来表示色空间转换矩阵.

2012-07-29

室内场景视频结构化描述系统设计

视频结构化描述是对一种视频内容信息提取和应用的技术, 它对视频内容按照语义关系, 采用时空分割、特征提取、对象识别等处理手段, 组织成可供计算机和人理解的文本信息的技术。本文介绍基于该技术的室内场景描述系统方 案, 系统实现对室内场景的描述以及相关描述数据的存储和分发。结果表明经过结构化描述的视频可提高应用效率。

2012-07-29

基于运动信息的二维到三维视频转换技术

基于运动信息的二维到三维视频转换技术的研究

2012-07-28

关于大小端--大端 小端 大小端

所谓的大端模式,是指数据的低位(就是权值较小的后面那几位)保存在内存的高地址中,而数据的高位,保存在内存的低地址中,这样的存储模式有点儿类似于把数据当作字符串顺序处理:地址由小向大增加,而数据从高位往低位放; 所谓的小端模式,是指数据的低位保存在内存的低地址中,而数 据的高位保存在内存的高地址中,这种存储模式将地址的高低和数据位权有效地结合起来,高地址部分权值高,低地址部分权值低,和我们的逻辑方法一致。

2011-07-23

wince 实现远程桌面连接

wince 实现远程桌面连接 WinCE支持远程桌面功能,可以在PC端访问目标设备的WinCE桌面。这个功能在调试的时候很有用。有些时候,你的目标板不带显示设备,这时你想访问 目标板的WinCE系统感觉很不爽,毕竟习惯了桌面操作。通过WinCE远程桌面,你可以在PC上面访问目标板的WinCE桌面并进行操作。下面的操作已 经在一块ARM9板子上实验通过了,当然前提是板子的以太网驱动和连接已经正常。

2011-07-07

ISO/IEC 14496--14----------MP4 File Format

ISO/IEC 14496--14----------MP4 File Format

2011-06-11

ISO/IEC 13818-7----AAc 音频格式解释文档

ISO/IEC 13818-7:2006 specifies MPEG-2 Advanced Audio Coding (AAC), a multi-channel audio coding stan

2011-06-11

Mp4Creator source code

Mp4Creator source code

2011-05-28

mp4 creator- win32

MP4Creator Version 1.6.1e-pre - by Crypto/DVBPortal 01-Jan-2009 --------------------------------------------------------------------------- This release includes the following components, in the indicated folders: mp4creator.exe - the muxer component readme.txt - the file you are just reading COPYING - the copying license AUTHORS - the original authors --------------------------------------------------------------------------- About this release: MP4Creator is the command line mp4 multiplexer tool from the mpeg4ip project. Since the mpeg4ip projects has stopped in Sep-2007, several community patches have been created for mp4creator. This project consolidates all patches to the original project files, to have the latest version which includes all features developed so far. Wich are: Nero and Quicktime chapters patch By: Ullrich Poll鋒ne (pollaehne) - 2007-10-03 11:22 contains infos from HandBrake and gpac to create/delete/convert Nero and Quicktime(iTunes/iPod) chapter markers in MP4 files Support for QuickTime Display Aspect Ratio patch By: Mark T (tuber99) - 2007-10-22 15:46 There are two new command-line params when adding a video track: -qth=xxx and -qtw=xxx Fix for "Video track has no data size" patch By: Crypto - 2008-05-25 16:38 Encodes containing B-frames need a edts/elst box combination Fix for missing C++ 2005 Runtime Libs SP1 By: Crypto - 2008-07-06 11:52 Project settings changed for statically linked C++ runtime Feature added for AC-3 support as of ISO/IEC 14496-12 Annex F By: Crypto - 2008-10-02 11:52 allows to multiplex AC-3 multi channel tracks conforming to the newly released ISO/IEC 14496-12 Annex F Fix for track name display (AC-3 track) By: Crypto - 2009-01-01 12:48 AC-3 tracks shown now as "surround" Fix for garbled compressor name display in Quicktime (MAC-Version) By: Crypto - 2009-01-01 12:48 AVC video tracks show now as H.264 --------------------------------------------------------------------------- Installation: No installation required. Copy all files to a directory of your choice. All included binary files made by Crypto/DVBPortal are digitally signed. You should verify the signature before installing them, for your own protection against forgery. --------------------------------------------------------------------------- Usage: This is the command line mp4 multiplexer tool from the mpeg4ip project. It is used to multiplex streams to the MP4 container -or - to demultiplex streams from an existing MP4 file. The updated mp4creator project home is located here: http://sourceforge.net/projects/mp4creator The original mp4creator is part of the mpeg4ip project located here: http://sourceforge.net/projects/mpeg4ip Please make sure to check out the full-featured GUI mp4muxer for mp4creator located here: http://www.dvbportal.de/projects/mp4muxer Enjoy! --------------------------------------------------------------------------- History: 01-Jan-2009 Fix for track name display (AC-3 track) Fix for garbled compressor name display in Quicktime (MAC-Version) 02-Oct-2008 AC-3 support as of ISO/IEC 14496-12 Annex F added 06-Jul-2008 Version 1.6.1c Fix for missing C++ 2005 Runtime Libs SP1 30-Jun-2008 Version 1.6.1b Nero and Quicktime chapters patch Support for QuickTime Display Aspect Ratio patch 05-Jun-2008 Initial branch release Version 1.6.1a Fix for "Video track has no data size" patch Any comments and feature requests are welcome. Please use our forum http://dvbportal.dyn1.de/forum ###

2011-05-28

Quick Time File Format---qtff

Quick Time File Format

2011-05-11

WinCe中bib文件的作用

BIB的全称为Binary Image Builder,在Wince编译过程中的最后MakeImage阶段会用到BIB文件,BIB文件的作用是指示构建系统如何构建二进制映像。所有的BIB文件会被合并成CE.bib文件,然后打包工具Romimage.exe会根据BIB文件中的描述来决定哪些文件最终被包含到WINCE image中,BIB文件还决定了WINCE设备内存的分配,比如定义了WINCE image占用哪块内存,显存(Framebuffer)占用哪块内存等。

2011-05-05

流文件mp4研究大礼包

mp4研究大礼包,所有资料源自本人研究期间搜集整理,非常实用,特回馈给所有从事mp4流媒体技术研究的朋友。 使用说明: 论文文档: 关于流式mp4文件研究的一些经典论文,注意,是中文的哦 开源库: MPEG4IP mp4v2的开源库,不用说了,大杀器 DirectShosw filter mp4 pharser filter ,运行环境:wince 6.0, 功能:读取mp4文件,解析出视频流和音频流 齐全的源代码,稍作修改,即可编译使用,注意,是ce6.0 编译工具:platform builder

2011-04-11

G.711 DirectShow Encoder Filter

directshow 架构下的g.711音频编码filter vc6源代码,以及编译好的可用组件

2011-03-23

采用directshow架构实现的嵌入式远程音视频传输系统

使用directshow方案开发的嵌入式远程视频监控的经典论文,不仅介绍了directshow的使用方法,关键之处是详细的介绍了本方案中sourece filter, mpeng4encoder filter netsender filter的开发关键步骤,给出了源代码,版权归原作者所有,仅供参考学习!

2011-03-15

linux pthread 多线程控制示例代码

一个示例程序,演示在linux环境下如何使用pthread实现多线程的使用和控制。

2015-01-08

基于Android的P2P手机高清视频在线点播系统

开发P2P在线高清视频点播系统采用专门用于Android平台的JXTA关键协议,组成一个虚拟的P2P对等网络,并进行模拟节点间的视频文件传输,满足多客户端同时在线的视频点播需求.在播放器方面,采用Android自带的API进行视频和音频解码,可以实现高清MP4(H.264编码流)的播放需求,提供了良好而全新的用户体验.

2014-11-27

android读取手机短信功能代码(包含收件箱、发件箱、草稿箱)

android读取手机短信功能代码(包含收件箱、发件箱、草稿箱),功能强大,可以很快嵌入到你的应用中。

2014-11-19

使用eclipse/ndk-gdb对java/native code联合调试

必很多网友都有这样的疑惑,我的程序中上层是java代码,下层使用c/c++ 写的,那到底要怎么调试呢? 我们首先想到的是ndk-gdb,ndk是google提供的用来native code开发的,ndk-gdb使用来调试native code的。 我们还知道eclipse是用来调试java code的,它不能直接调试native code。 如果能将二者结合起来,一边用eclipse调试java代码,同时用ndk-gdb调试,那就再好不过了。

2014-11-04

jni回调Java层函数示例

NI是Java Native Interface的缩写,是Java平台的重要特性,使得Java代码可以方便地与C/C++代码编译生成的动态链接库进行交互。本文主要给出一份示例代码(工程文件见附件),描述如何在Android的JNI层开启一个线程,并在线程中回调Java层的函数。

2014-10-13

Android应用源码通用UPnP、DLNA安卓播放器项目

本项目源码就是一套基于uPnP/Dlna的家庭互联项目源码,可以轻松播放手机中的音视频和网络上的UPnP服务器媒体文件,并且可以实现全功能控制。项目主页:https://code.google.com/p/wireme/source/checkout 缓存 Dlna 视频播放 音频播放

2014-09-28

查看手机屏幕分辨率软件

查看手机屏幕分辨率软件

2014-09-04

TextureView预览Camerademo

用TextureView预览Camera的demo

2014-08-25

fdk-aac windows平台编译脚本

fdk_aac windows平台的编译脚本

2014-05-12

android 录音机 源码

使用 AudioRecord 和AudioTrack 实现录音机

2014-04-18

vlc media player 插件源码

vlc 的activex 和firefox播放插件源码,注意编译该工程请包含inclide目录和lib目录,该文件在vlc media player的安装路径下由此文件,若运行,则需要module目录的支持。

2013-11-20

语音信号特征提取中Mel倒谱系MFCC的改进算法

从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数 (Mel—Frequence cepstral coemcients,MFcc)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和 传统算法在语音识别系统中的差别。

2012-08-19

基于光流法对移动目标的视频检测与应用研究

视频检测技术是多学科的交叉与结合,既是一门科学学科又是一门工程学科,运用机器视觉和数字图像处理技术,探讨机器视觉技术在驾驶员桩考系统中的实现方法,这对机器视觉技术方法研究和实际应用具有一定的价值。本文以驾驶员桩考系统为研究对象,采用图像处理技术和机器视觉理论方法,研究如何在熟悉或不熟悉环境条件下检测和识别出运动目标,自动跟踪和测量所监控运动的车辆目标。本文基于机器视觉研究从图像或图像序列中提取信息,对客观景物和物体进行形态和运动识别,获取周围环境的信息,计算目标物体运动的方向和速度。研究内容如下:1.采用了背景差分和帧间差分相结合的方法,对序列图像进行分析,分割运动区域,检测、提取运动目标;2.对差分图中灰度值不为零的像素点,采用帧间差阈值和光流法求出其光流场分布;3.做了以针孔模型下摄像机标定,并分析计算图像中物体的深度信息;4.结合移动机器人系统,按照桩考系统的场景和要求,研究基于机器视觉的机器人模型设计,对桩考实现。在Windows环境下设计了系统整体功能结构和软件算法,实验证明,该方法对移动目标的提取识别与跟踪具备不易受干扰和快速的特性,效果良好。可有效地提高驾驶员桩考的公正性...

2012-08-15

H.264 and MPEG-4 Video Compression

He is also the Rapporteur of Advanced Video Coding in the ITU-T, where he has led VCEG (ITU-T Q.6/SG16) for about seven years. He is also the ITU-T video liaison representative to MPEG and served as MPEG’s (ISO/IEC JTC1/SC29/WG11) video chairman from March of 2001 to May of 2002. He is currently a program manager of video standards and technologies in the eHome A/V platforms group of Microsoft Corporation. At Microsoft he designed and remains active in the extension of DirectX® Video Acceleration API/DDI feature of the MicrosoftWindows® operating system platform.

2012-08-11

一种利用空域相关性的块匹配算法

本文提出了一种枯计运动矢量的块匹配算法∗ 该算法以失配度为匹配准则, 利用相邻象素块的空域运动相关性减少计算量∗ 文中还将该算法的性能 与其它块匹配算法进行了比较∗

2012-08-10

综合MPEG-7中颜色特征的图像检索方法

提出一种综合MPEG 7建议的主颜色和颜色布局的方法。给出了主颜色和颜色布局的提取方法,详细介绍了MPEG 7标准的颜色评价准则,并以此作为评判检索结果优劣的依据。综合利用两种特征对图像进行描述及检索,获得了比使用单一特征更好的检索效果。

2012-08-07

基于MPEG-7标准的视频描述与检索

随着计算机以及通信技术的发展,以视频为代表的多媒体数据量和信息量急剧增长。视频数据的日益增加,应用也越来越广泛。现在,在数字图书馆、军事信息系统、Web信息环境、专业视频库等应用,需要对视频数据和视频信息进行组织和管理。同传统的文字信息相比较,视频数据具有信息量大、难以准确描述的特点,因此人们很难从海量的视频信息中找到自己所需的信息。虽然过去开展了大量的视频数据库、视频分析和信息检索的研究,但是缺乏对视频数据进行完整的、规范性的描述,以及建立在这些规范描述之上的视频信息检索方法。本文在分析研究了现有一些基于内容的视频处理和检索方法的基础上,结合MPEG-7标准的新框架,对视频内容规范描述及其检索方法进行了研究,主要的研究工作如下: 1.视频内容分析和规范化描述:根据MPEG-7标准,首先对视频内容进行分析,然后进行规范化的描述。本文在视频内容分析的基础之上,建立了基于MPEG-7标准的视频内容描述模型。该模型从视频数据的特性出发,既综合考虑了视频的各种特征,包括视觉特征、对象空间关系和时间结构,又充分考虑了视频信息检索的要求,采用层次化的描述结构。

2012-08-07

一种基于MPEG

为了改进现有关键帧提取方法在相邻帧间相似性测度方面的不足, 提出一种基于M PEG

2012-08-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除