一、挖掘内容

多媒体数据:多维的,非结构化或者半结构化的数据

多媒体数据库:数据量大,数据结构复杂,模式多样

细分领域:图像挖掘、视频挖掘、音频挖掘、web挖掘、多媒体综合挖掘

二、挖掘定义

   多媒体数据挖掘:多媒体信息处理技术和数据挖掘技术结合,综合分析视听特性和语义,发现隐含的、有效的、可理解的模式,得出时间的趋向和关联

三、多媒体数据挖掘系统模型

1、多媒体数据库

     元数据:对媒体对象信息和内容的解释

2、数据预处理器

识别和纠正或消除冲突、不完整数据以及组合数据库所共有的不兼容性

数据清理:填写缺失值、光滑噪声数据、识别删除离群点,消除脏数据

数据集成:将来自不同数据源的的数据整合成一致的数据存储,元数据、相关分析、数据冲突检测和语义异构性的解决在于此步骤

数据变换:将数据库中的原始数据转换成适合数据挖掘的数据形式,

数据归约:用数据立方体聚集,属性子集选择、维度归约、数值归约和离散化得到数据的归约表示,降低信息内容的损失。

3、挖掘引擎

   一组算法:分类、聚类、关联规则、趋势分析

4、数据挖掘界面

四、多媒体数据挖掘的方法

  1、数据立方体

       一般是多维的,

      通过上卷、下钻、切片和切块、旋转进行强有力的分析

  2、聚类算法

      无监督学习

  3、分类算法

       监督学习