数据挖掘学习笔记-入门基础篇

最新推荐文章于 2022-06-22 17:14:19 发布

小雨滴滴滴的童鞋

最新推荐文章于 2022-06-22 17:14:19 发布

阅读量811

点赞数

分类专栏：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011926899/article/details/51849519

版权

数据挖掘专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1、什么是数据挖掘

数据挖掘时在大型数据存储库中，自动的发现有用信息的过程。数据挖掘技术用来探查大型大数据，发现先前位置的有用模式。

2、KDD -konwledge discovery in database

数据挖掘时KDD中不可或缺的一部分

3、数据挖掘任务

预测任务：这些任务的目标是根据其他属性的值，预测特定属性的值。被预测的属性一般称为目标自变量或因变量，而用来做预测的属性称说明变量和自变量。

描述任务：其目标是到处概括在数据正潜在联系的模式（相关、趋势、聚类、轨迹、聚类和异常）。本质上，描述性数据挖掘任务通常是探查性的，并且常常需要后处理的技术验证和解释结果。

4、四种主要数据挖掘任务：聚类分析、预测建模、异常检测、关联分析

预测建模（predictive modeling）：设计说明变量函数的方式为目标变量建立模型

1、分类：用于预测离散的目标变量

2、回归：用于预测连续的目标变量

关联分析（association analysis）：用来发现描述数据中强关联特征的模式。所发现的模式通常用蕴含规则或特征子集的形式表示。（啤酒与尿布问题）

聚类分析（cluster analysis）：旨在发现紧密相关的观测值族群，使与不同簇的观测值相比，属于同意粗的观测值相互之间尽可能相似。聚类可用来对相关顾客分组，找出显著相关影响地球气候的海洋区域以及压缩数据。

异常检测（anomaly detection）：识别其特征显著不同于其他数据的观测值。这样的值称为异常点（anomaly）或离群点（outliter）。异常检测的目标是发现真正的异常点而避免错误的将正常对象标注为异常点。

小雨滴滴滴的童鞋

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。