《数据挖掘基础》习题六

1.简单地描述下列英文缩写或短语的含义。
(1)Sequential Mining
(2)Time series
(3)Offset Translation
(4)Subsequence Ordering
(1)Sequential Mining是序列挖掘,序列挖掘是指从序列数据库中发现蕴含的序列模式,一般是指相对时间或者其他顺序出现的序列的高频率子序列的发现,典型的应用还是限于离散性序列。
(2)Time series指时间序列,从统计意义上来讲,时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。前后时刻的数值或数据点的相关性往往呈现某种趋势性或周期性变化。
(3)Offset Translation指偏移变换,两个序列做相应的偏移变换与幅度缩放可以得出两个序列具有很强的相似性。
(4)Subsequence Ordering是子序列排序,子序列排序的主要任务是从没有重叠的子序列匹配中找出匹配得最长的那些序列。如果把所有相似的原点对看作图论中的顶点,两个窗口的缝合看作两个顶点之间的边的话,那么从起点到终点有多条路径,子序列排序就是寻找最长路径。

3.简述时间序列挖掘的概念。
时间序列挖掘通过对过去历史行为的客观记录分析,揭示其内在规律(如波动的周期、振幅、趋势的种类等),进而完成预测未来行为等决策性工作。人们希望通过对时间序列的分析,从大量的数据中发现和揭示某一现象的发展变化规律或从动态的角度刻画某一现象与其他现象之间的内在数量关系,以掌握和控制未来行为。
简言之,时间序列数据挖掘就是要从大量的时间序列数据中提取人们事先不知道的,但又是潜在有用的与时间属性相关的信息和知识,并运用于短期,中期和长期预测,指导人们的社会经济,军事和生活等行为。

15.简述序列模式挖掘的一般步骤。
步骤分别是排序阶段、大项集阶段,转换阶段、训练阶段以及选最大阶段。

16.简述序列模式挖掘的各个步骤的主要任务。
排序阶段:
对于数据库进行排序,排序的结果将原始的数据库转换成序列数据库。
大项集阶段:
找出所有频繁的项集组成的集合L。
转换阶段:
在寻找序列模式的过程中不断地检测一个给定的大序列集合是否包含于一个序列中。在转化完成的序列中。每条记录被其所包含的所有大项集所取代。
序列阶段:
利用转换后的数据库寻找频繁的序列即大序列。
选最大阶段:
在大序列集中找出最长序列。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lazyn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值