挖掘对象、空间、多媒体、文本和Web数据

本文探讨了如何处理和挖掘不同类型的数据,包括复杂数据对象、空间数据、多媒体数据、文本数据以及Web信息。数据挖掘涉及建立多维数据仓库、空间数据立方体处理、空间聚类方法、文本信息检索及Web信息的秩评定。理论基础涵盖数据规约、概率论等,应用数据挖掘的前提是充足的数据和考虑成本效益。
摘要由CSDN通过智能技术生成

 

 

1.复杂数据对象的挖掘处理

答:这里的对象是指复杂但相对结构化的数据对象,这些数据对象不能简单的用数据关系来表示,大多数拥有这些数据的应用基本上是面向对象的。这个时候,对数据对象的挖掘就是对复杂结构化的数据对象进行处理。挖掘复杂数据对象的任务是建立复杂对象的多维数据仓库,做联机处理分析,针对多维数据仓库做有效、可伸缩的数据挖掘。结构化多维数据挖掘处理遵循通用的挖掘过程,可以采用一般的数据规约方法。

 

2.空间数据的挖掘处理

答:空间数据的特点是存在大量与空间相关的数据,包含拓扑或者距离信息,对地理、空间方面有帮助。空间数据挖掘是指提取空间数据库中非显式存储的知识、空间联系或其他有趣的模式。空间数据仓库是面向主题的、集成的、时变的、非易失性的空间数据和非空间数据的集合,用于支持空间数据挖掘和与空间数据相关的决策过程。

由于空间数据信息由空间信息和非空间信息两部分组成,,所以针对空间信息要采用专门的空间维度来保存,做空间信息的挖掘;针对非空间信息要在空间维度的基础上进行非空间信息的处理。空间信息的常用数据挖掘方法有空间数据立方体处理方法和空间聚类方法。

 

3.多媒体数据的挖掘处理

答:多媒体数据信息是多类信息的数据集合,这些信息数据集合的信息类型有视频、图像、图形、声音、文本、文档、超文本数据等。对多媒体数据的数据挖掘就是针对各种信息类型进行数据挖掘,可以是组合信息的索引,也可以是信息内容。多媒体信息的数据挖掘是一种复合型的数据挖掘,可能同时要使用多种数据挖掘的方法,分别处理图像、文本、声音、空间等。

 

4.文本数据的挖掘处理

答:文本信息是有各种数据文档组成的,与其他类型的数据不同,文本数据的数据挖掘任务重点关心文

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值