数据挖掘习题

数据挖掘概念与技术课后习题

#数据转换

在这里插入图片描述

我的想法:
在这里插入图片描述

数据处理

在这里插入图片描述

  1. 光滑数据:采用滑动平均的方法,设置window_size,进行光滑
  2. 规范化:两种方法,归一化、标准化
    在这里插入图片描述
  • 补充:如果数据不是数值类型的,先进行属性映射,再序列标准化

Z = m i − 1 M a x ( m ) − 1 Z = \frac{m_i -1}{Max(m) -1} Z=Max(m)1mi1

哈尔小波分解

在这里插入图片描述
步骤:

  1. 按粒度求window均值(粒度就是window_size,不重叠的)
  2. 求window的最大的数和均值的差
  3. 重复1、2把序列遍历完
  4. 合并均值和求完差值的结果,长度应该和原序列等长
  5. 重复以上4步,直到达到设定的轮数,分解的越来越小

请添加图片描述

距离计算

在这里插入图片描述
三种距离描述:
在这里插入图片描述
在这里插入图片描述

Aprior

{1,3,6,8,9}可能的子项集,及频繁子项集
请添加图片描述

FP-Growth

T1

在这里插入图片描述
请添加图片描述

T2

请添加图片描述
个人题解:
请添加图片描述

请添加图片描述

关于频繁项集的概念

请添加图片描述

关联规则

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 写的不对,emmm

判断是否频繁的依据是:
X是否为任一闭频繁项的子集,如果是则频繁,支持度为所属闭频繁项集(集合C中,X可能是多个闭频繁项集的子集)中,支持度计数最大的闭频繁项集的支持度。

  • 所以第二问:应该是X所属闭频繁项集中,支持度计数最大的

SVM

请添加图片描述

请添加图片描述

请添加图片描述
请添加图片描述

灰色预测模型:

灰色模型(Grey Model,简称GM模型)一般表达方式为GM(n,x)模型,其含义是:用n阶微分方程对x个变量建立模型。

通过把分散在时间轴上的离散数据看成一组连续变化的序列,采用累加和累减的方式,将灰色系统中的未知因素弱化,强化已知因素的影响程度,最后构建一个以时间为变量的连续微分方程,通过数学方法确定方程中的参数,从而实现预测目的。

请添加图片描述

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值