数据挖掘概念与技术课后笔记

                                                                                           数据挖掘概念与技术一

数据爆炸:自动数据收集工具和成熟的数据库技术使大量的数据被收集,储存在数据库、数据仓库或其他信息库中以待分析。

数据挖掘:从大量的数据中挖掘令人感兴趣的、有用的、隐含的、先去未知的和可能有用的模式或知识。
数据挖掘应用:数据分析和决策支持。
市场分析和管理、风险分析和管理欺骗检测和异常模式的监测(孤立点)、文本挖掘和WEB挖掘、流数据挖掘、DNA和生物数据分析。
数据库中的知识挖掘(KDD):数据库(数据清理和数据集成)-->数据仓库(任务相关数据)-->数据挖掘-->模式评估-->Knolwledge
知识挖掘的步骤:
1:了解应用领域(相关的知识好应用的目标)
2:创
建目标数据集:选择数据
3:数据清理和预处理数

4:数据缩减和预处理
5:选择数据挖掘功能:数据总结,分类,回归分析,关联规则,聚类分析等。
6:选择数据挖掘的算法
7: 据挖掘:寻找感兴趣的模式
8:模式评估和知识表达
9:运用发现的知识
商业智能:数据源--预处理--数据仓库--数据统计分析查询和报告--数据挖掘(信息发现)--数据表示(可视化)--决策支持
数据挖掘的数据来源:关系数据库、数据仓库、事务数据库、高级数据库系统和信息库(空间数据库【地图矢量存储】、时间数据库和时间序列数据库【存放包含时间相关属性的时间】、流数据【连续的、有序的、变化的、快速的、大量的数据输入的数据<网络监控、网页点击流、股票市场><存储在内存上,非流媒体是存储在本地磁盘上>】、多媒体数据库(实现计算机管理庞大的多媒体数据<图形、图像、声音、视频>,二进制大对象(将多媒体数据看成二进制))、面向对象的数据库和对象-关系数据库(数据以对象的形式存储)、异种数据库(历史数据库存储方式不同,数据表达方式不同,数据共享:数据库转换,实现数据的透明访问<用抽象层屏蔽掉各个数据的不同>)和历史数据库LEGACY(WEB SERVICE技术有利于历史数据库数据的重新利用)、文本数据库<存储的是对对象的文字性描述,分为无结构(大部分的文本资料和网页)、半结构(XML树型结构)和结构类型(图书馆数据)>和万维网


数据挖掘的方法:
1:概念/类描述:特征化和区分。
2:关联分析
3:分类和预测
4:聚类分析
5:孤立点分析
6:趋势和演变分析
7:其他定向模型或统计分析
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值