数据挖掘|序列模式挖掘及其算法的python实现

皖山文武

已于 2024-08-10 17:46:42 修改

阅读量1.5k

点赞数 24

分类专栏：数据挖掘商务智能文章标签：数据挖掘 python 序列分析序列模式挖掘

于 2024-04-05 22:37:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/benxuu/article/details/137382408

版权

数据挖掘|序列模式挖掘及其算法的python实现

1. 序列模式挖掘
2. 基本概念
3. 序列模式挖掘实例
4. 类Apriori算法（GSP算法）

1. 序列模式挖掘

序列(sequence)模式挖掘也称为序列分析。
序列模式发现（Sequential Patterns Discovery）是由R．Agrawal于1995年首先提出的。
序列模式寻找的是事件之间在顺序上的相关性。

例如，“凡是买了喷墨打印机的顾客中，80%的人在三个月之后又买了墨盒”，就是一个序列关联规则。对于保险行业，通过分析顾客不同次的购买行为发现，顾客本次购买重疾险，下次购买分红保险，则企业可以通过对重疾险销量的统计来预测分红险的销售量。

序列模式挖掘在交易数据库分析、Web访问日志分析以及通信网络分析等领域具有广泛的应用前景。

2. 基本概念

设 $I={i_1,i_2,...,i_n}$ 是一个项集，序列就是若事件（元素）组成的有序列表。

一个序列 $S e$ 可表示为 $s_1,s_2,...,s_n>$ ，其中 $s_j(j=1,2, …, n)$ 为事件，也称为 $S e$ 的元素。

元素由不同的项组成。当元素只包含一项时，一般省去括号，例如， ${i_2\}$ 一般表示为 $i_2$ 。

元素之间是有顺序的，但元素内的项是无序的，一般定义为词典序。序列包含项的个数称为序列的长度，长度为 $L$ 的序列记为 $L - 序列$ 。

序列数据库就是元组 $< s i d,$

最低0.47元/天解锁文章

关注

24
点赞
踩
24

收藏

觉得还不错? 一键收藏
打赏
0
评论
数据挖掘|序列模式挖掘及其算法的python实现

序列模式的发现是由R．Agrawal于1995年首先提出的。序列模式寻找的是事件之间在顺序上的相关性。例如，“凡是买了喷墨打印机的顾客中，80%的人在三个月之后又买了墨盒”，就是一个序列关联规则。对于保险行业，通过分析顾客不同次的购买行为发现，顾客本次购买重疾险，下次购买分红保险，则企业可以通过对重疾险销量的统计来预测分红险的销售量。序列模式挖掘在交易数据库分析、Web访问日志分析以及通信网络分析等领域具有广泛的应用前景
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

皖山文武 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。