数据挖掘学习笔记1:引论

本文介绍了数据挖掘的发展动力,强调了在数据爆炸时代,如何从丰富的数据中提炼有价值的信息。阐述了数据挖掘的概念及其与其他术语的区别,并探讨了其在市场分析、欺诈检测等多个领域的应用。此外,还概述了数据挖掘的步骤、主要方法,包括聚类分析、孤立点分析等,以及评估模式有趣性的标准。数据挖掘是多学科的融合,涉及数据库技术、统计学和人工智能等领域。
摘要由CSDN通过智能技术生成

参考自王灿的数据挖掘课程

数据挖掘的发展动力

数据爆炸

  • 自动数据收集工具和成熟的数据库技术使得大量的数据被收集,存储在数据库,数据仓库或其他信息库中以待分析.

有丰富的数据但缺乏有用的信息

解决办法

  • 数据仓库(Data Warehouse)
  • 在线分析处理(OLAP)
  • 数据挖掘(挖掘感兴趣的知识)

数据库技术的演化

文件系统与数据库系统的区别

数据库系统的特点

  • 数据存储(文件系统有)
  • 查询处理(sql)
  • 事务处理和并发访问的控制

文件系统

  • 数据存储
  • 数据访问

什么是数据挖掘

数据挖掘

  • 从大量数据中挖掘哪些令人感兴趣的,有用的,隐含的,先前文职的和可能有用的模式或知识
  • 挖掘的不仅仅是数据(数据挖掘并非一个精确的用词,知识挖掘,知识提炼更为精确)
    注意 :挖掘的不是数据而是知识和有用的模式!

数据挖掘的替换词

  • 数据库中的知识挖掘(
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值