数据挖掘与数据仓库——数据挖掘概述

专题介绍

该专题是数据挖掘与数据仓库专题,博主在复习过程中针对老师的PPT进行的整理,使得逻辑更加方便学习。对于初步入门数据挖掘与数据仓库是可以作为参考的,如果想深入了解,则需要看更全面的教材。不足之处请大家多多指教。

文章列表:

数据挖掘概述

数据预处理

数据仓库、 OLAP及数据立方体计算

关联规则挖掘

分类

聚类

PDF资料下载


数据挖掘概述

什么是数据挖掘

DB派:
从海量数据中提取有兴趣的模式或知识;
数据库中的知识发现(Knowledge Discovery in Databases, KDD)

为什么需要数据挖掘

数据爆炸问题:数据自动获取技术的不断发展,导致了数据呈指数级增长。

针对什么样的数据

  • 关系数据库(Relational database)
  • 数据仓库(Data warehouse)
  • 事务数据库(Transactional database)
  • 高级数据库
    • 空间数据库(Spatial data)
    • 时间序列数据(Time-series data )
    • 多媒体数据库(Multimedia database)
    • 文本数据库与WWW(Text databases & WWW)

数据挖掘功能

  • 分类与回归分析(Classification & Regression)
    对类或者概念构造模型或函数以便对未来数据进行预测表示: 决策树, 支持向量机, 概率图模型, 深度网络等。

  • 聚类分析(Clustering)
    类标识符是未知的: 把数据分成不同的组。使得同一组中的元素具有极大的相似性, 不同组元素的相似性极小。

  • 关联分析(Association, Correlation)
    通过数据分析事物之间的关联性。

  • 强化学习(Reinforcement Learning)

  • 网络分析(Network Analysis)
    链接分析与Ranking;网络传播影响力分析。

  • 数据摘要(Data Summarization)
    摘要(Summarization), 如文本摘要、视频摘要等

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值