多媒体信息检索的研究报告

                         多媒体信息检索研究报告

1、        引言

互联网已经在全世界范围发展开来,随着海量信息的涌入,想要在互联网上找到自己想要的东西已经越来越来困难,为了满足人们的这一需求,很多公司推出了自己的基于互联网的搜索服务,比如Google,Yahoo,百渡,3721等搜索引擎,这很大程度上给人们获取信息提供便利。但这还不能完全解决问题,因为现在几乎所有的搜索引擎提供的功能只是基于普通文本的搜索,对各种格式的文档、电子表格的搜索就很少了,而对多媒体信息的检索就几乎没有了。因此现在迫切需要一种手段用来检索庞大的多媒体信息。

2、        多媒体

作为信息传递、娱乐等多种用途,多媒体已经发展的比较庞大和完善了。现在的多媒体信息主要分为3大类:视频、音频和图像。而每一大类又分很多小类,比如视频就包括很多格式的视频信息:RealMediaDivX等,图像也分为jpggif等多种图像。并且这些大类也就交叉的的地方,有些对媒体既包含视频信息又包含音频信息,甚至还包含图像信息。因为多媒体的种类如此之多,要针对所有的多媒体信息检索的难度也就大大增加,这也就是我们研究的方向。

3、        多媒体信息检索借口的研究

多媒体信息的检索主要是针对多媒体信息内容的检索,比如音频内容、图像内容等。因为不同的对媒体有一定的差异,所以分类研究检索借口。现在假定所有的多媒体信息已经具备,也就是不需要专门去搜寻那些多媒体信息。

a)     视频。大家平常见到的各种视频悉信息有各种电影文件,比如各种rmvbasfmpegavi等。对这些视频检索的方式多种多样,比如可以用影片的名字来检索,用影片里面任务说的话来检索,用影片里面的各个特定的镜头检索,甚至用一连串的镜头片断检索和用一段故事情节去检索。当然还可以用声音来检索,但这属于音频检索的范围了。

b)     音频。音频包含各种音乐文件,比如mp3wav等,甚至大部分视频文件也包含音频。如果有的话,可以用歌词名、歌手名、歌曲名去检索。还可以用音乐检索,比如随便哼一段曲调,然后就可以用这段曲调去检索。也可以用声音的强弱变化、声音所表达出来的一个感情气氛等检索。

c)      图像。现在的图像文件已经是多种多样,它能表达的信息也丰富多彩。可以用图像本身的特征去检索,比如用图像的纹理、颜色、明暗度去检索。也可以用简略图来检索,比如给出一幅草图,就能搜索出于折服草图相似的图片来。还可以用图像所表达的信息去检索,比如用“男人”这个词就能搜索到所有男人的图片,用“乔丹”这个词就可以找出有乔丹的图片。

4、        信息检索功能实现的研究

多媒体不同于普通文本,它表达的内容的复杂度、抽象度要远远高于普通文本,因此对它检索的难度也就远远大于普通文本。有人提出:可以先对不同的多媒体信息进行人工处理,在需要的地方加上注释,检索信息的时候只需要检索注释就可以了,这在少量信息的情况下可行,如果信息迅速增多,那么注释多媒体信息所花费的人力物力是不可接受的。也有人提出:可以先把各种对媒体信息转换成普通文本,然后建立索引结构,可以针对索引查询,这个方案可以重分利用现有的文本搜索技术,但是怎样把多媒体信息转换成普通文本是一大难题。还有一种就是重新制定对媒体信息的格式标准,使这个格式既能够有充分表达力又要具有方便被查询,这也是一个研究方向,主要问题是这种格式标准的制定。

5、        小结

随着多媒体技术的发展,可能多媒体的种类会越来越多,也许并不止上面说的那些,但是总的方向应该不会相差太远。现在面临的主要问题就是有想法,但是没有技术能力去实现。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值