MS顺序与聚类分析算法
1. 它是结合了顺序分析和聚类分析的唯一算法,它是查找顺序中包含类似路径的事例的分类,也就是对相似顺序的事例进行分类。(此算法的可操作性似乎不强)
2. 分析模型的建立
2.1. 数据准备,可以使用关联规则分析模型使用的数据
2.2. 参考关联规则分析模型的建立,直到指定定型数据
2.3. 指定定型数据:指定用来给模型进行定型的数据
2.3.1. 键:指定主表和嵌套表的键-》主表:“saleKey”-》嵌套表:“sequence”
2.3.2. 可预测列:我们要预测的是会员要去消费的店铺-》所以勾选“storeName”
2.3.3. 输入列:我们将可能产生影响的字段都勾选上,如果不清楚可以点击建议查看-》这里勾选storeName和sequence
3. 配置及重要参数
3.1. 嵌套表必须有购买顺序字段
3.2. Cluster_count:限定分类的数量
3.3. Minimum_support:分类的最小事例数,就是一个分类包含的事例数量的最小值
4. 挖掘模型查看器,大部分类型聚类模型,主要两点不同
4.1. 分类特征,中带“[开始]->”标志的,表示客户最先可能购买的项(这是基于时序算法才有的)
4.2. 状态转换,我们找一个带“[开始]”标志的商品,然后在状态转换中找到该商品,该商品处罚的箭头指向的商品,就是可能购买该商品后的下一个商品,箭头标的数值就是概率
5. 挖掘模型预测
5.1. 选择相应挖掘模型
5.2. 选择输入表-》选择主表-》选择嵌套表-》修改输入表与挖掘模型间的映射
5.3. 配置预测函数,源:“预测函数”-》字段:“PredictSequence”,预测序列-》条件/参数:拖入要模型的嵌套表,模型的嵌套部分就是要预测是部分-》然后在后面加上“,2”,意思是预测两个店铺
5.4. 配置输出字段,选择输入表中相应的表和字段,此处配置的是要预测的数据的输出