SPSS Modeler数据挖掘:数据挖掘概述

什么是数据挖掘

数据挖掘:是一种通过数理模式来分析大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法。可以描述为 :是按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的、或验证已知的规律性,并进一步将其模型化的先进的有效的方法。

数据挖掘(Data Mining)在技术上的定义是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们事先不知道的,但又潜在有用信息和知识的过程。

这个定义包含多层含义:
- 数据源必须是真实的、大量的、含噪声的
- 发现的是用户感兴趣的知识
- 发现的知识要可接受、可理解、可运用
- 并不要求放之四海而皆准,仅支持特定的问题


数据挖掘的技术特征

数据挖掘的实际应用功能可分为3大类6项:Classification和Clustering属于分类区隔类;Regreesion和Time-Series Forecasting属于推算预测类;Association和Sequence Discovery则属于序列规则类。

  • Classification 是根据一些变量的数值进行计算,在依据结果进行分类。
  • Clustering 用于将数据分群,其目的是将群间的差异找出来,同时也将群内成员的相似性找出来。
  • Regression 是使用一系列的现有数值来预测一个连续数值的可能值。
  • Time-Series ForecastingRegression功能类似,只是它是利用现有的数值来预测未来的数值。
  • Association 是要找出某一事件或数据中会同时出现的东西。
  • Sequence DiscoverAssociation 关系密切,所不同的是 Sequence Discover 中事件的相关是以事件因素为区隔。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值