数据挖掘引言

数据挖掘是一种从大量数据中提取知识的技术,涉及数据清理、集成、选择和变换等预处理步骤。主要功能包括描述性和预测性挖掘,如模式特征化、分类、预测、聚类和离群点分析。数据挖掘可以应用于各种类型的数据源,如关系数据库、数据仓库等。然而,数据挖掘面临的问题包括与用户的交互、性能和异构数据源的处理。
摘要由CSDN通过智能技术生成

总述:数据挖掘是一种数据处理技术,针对历史存量数据进行分析,通过描述趋势来帮助客户。

 

  1. 数据挖掘产生的原因
  2. 什么是数据挖掘
  3. 可以对什么类型的数据进行挖掘
  4. 数据挖掘功能:可以挖掘什么类型的模式
  5. 数据挖掘的分类标准有哪些
  6. 数据挖局任务的原语有哪些
  7. 数据挖掘系统与数据系统的集成问题
  8. 数据挖掘的主要问题有哪些

 

1.数据挖掘产生的原因

答:数据系统的应用使得数据存量在一定规则下不断增长,从巨大数量的数据中进行数据分析成为一种需求,这种需求下产生了数据仓库和数据挖掘。数据仓库是一种将多个异构数据源在单个站点以统一的模式组织的储存库,可以支持管理决策。数据仓库技术包括数据清理、数据集成、联机分析处理。

 

2.什么是数据挖掘

答:数据挖掘是从大量数据中提取或‘挖掘’知识。

以知识发现过程的基本过程为背景:

  1. 数据清理(消除噪声和不一致的数据)
  2. 数据集成(多种数据源可以组合在一起)
  3. 数据选择(从数据库中提取和分析任务相关的数据)
  4. 数据变换(数据变换或统一成适合挖掘的形式,如汇总或聚集操作)
  5. 数据挖掘(基本步骤,使用智能方法提取数据模式)
  6. 模式评估(根据某种兴趣度量,识别表示知识的真正有趣的模式)
  7. 知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)

前面1-4是数据预处理,为挖掘准备数据。

在实际工作环境中:数据库、数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值