《R语言数据挖掘》——2.5 R语言实现

本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.5节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.5 R语言实现

算法主要部分的R语言实现为:

QQ_20170524175437
QQ_20170524175440

2.5.1 SPADE算法

使用等价类的序列模式发现(Sequential Pattern Discovery using Equivalent class,SPADE)算法是应用于序列模式的垂直序列挖掘算法,它采用深度优先策略。算法的特征是:

SPADE算法是Apriori算法的扩展。

算法采用Apriori性质。

需要对初始事务数据集进行多次扫描。

采用垂直数据格式。

算法采用简单的连接运算。

所有序列的发现都需要对数据进行3次扫描。

下面是调用SPADE算法之前的伪代码
F←, ∧k←0, P←{∈∑, support_count(s)≥MIN_SUP}
QQ_20170524175445
QQ_20170524175451

R语言实现

算法主要部分的R语言代码实现是:
QQ_20170524175454

2.5.2 从序列模式中生成规则

序列规则、标签序列规则和类序列规则都可以从序列模式中生成,这些可以从前面的序列模式发现算法中得到。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值