特性化、区分、关联和相关性分析、分类、回归、聚类、离群点分析定义

最新推荐文章于 2024-06-10 14:41:59 发布

狂奔的蜗牛

最新推荐文章于 2024-06-10 14:41:59 发布

阅读量5.3k

点赞数 1

分类专栏：数据挖掘

数据挖掘专栏收录该内容

42 篇文章 2 订阅

订阅专栏

数据特征化：是目标数据的一般特性或特征的汇总。数据特征化的输出可以由多种形式提供，例如饼图、条图、曲线、多维数据立方体、交叉表在内的多维数表。

数据区分：是将目标数据与其他对比类数据进行比较。

挖掘频繁模式、关联和相关性频繁模式包括：频繁项集、频繁子序列、频繁子结构。频繁项集：频繁的在事物数据集中一起出现的商品的集合。频繁子序列：如先购买相机，在购买三脚架，在购买闪光灯这样的一个频繁的模式就是频繁子序列。频繁子结构：设计不同结构形式（图、数、格）可以与子序列结合在一起。

关联：单维关联和多维关联规则。

用于预测分析的分类与回归分类：分类规则有IF-THEN规则、决策树、数学公式、神经网络。回归用来预测缺失的或难以获得的数值数据值，而不是（离散的）类标号。

聚类分析将数据对象划分为若干类，同一类的对象具有较高的相似度，不同类的对象相似度较低。从这个简单的描述中，可以看出聚类的关键是如何度量对象间的相似性。较为常见的用于度量对象的相似度的方法有距离、密度等。

离群点分析在样本空间中，与其他样本点的一般行为或特征不一致的点，我们称为离群点。

狂奔的蜗牛

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
特性化、区分、关联和相关性分析、分类、回归、聚类、离群点分析定义

数据特征化：是目标数据的一般特性或特征的汇总。数据特征化的输出可以由多种形式提供，例如饼图、条图、曲线、多维数据立方体、交叉表在内的多维数表。数据区分：是将目标数据与其他对比类数据进行比较。挖掘频繁模式、关联和相关性频繁模式包括：频繁项集、频繁子序列、频繁子结构。频繁项集：频繁的在事物数据集中一起出现的商品的集合。频繁子序列：如先购买相机，在购买三脚架，在购买闪光灯这样的一个频繁的模式就是频繁...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。