数据挖掘(五)频繁模式挖掘和算法

频繁模式挖掘是数据挖掘中的重要技术,用于发现数据集中的常见组合模式。本文介绍了频繁项集、关联规则、Closed Patterns和Max Patterns,以及Apriori等挖掘方法。频繁模式在购物篮分析、交叉营销等领域有广泛应用。
摘要由CSDN通过智能技术生成

什么是频繁模式(Frequent Pattern )分析?

频繁模式:在数据集中频繁出现的模式(项集,子序列,子结构等)

  • 项目集:牛奶和面包经常一起出现
  • 子序列:购买PC,然后购买数码相机
  • 子结构:大图中的频繁子图

频繁项集关联规则挖掘的背景下提出

动机:找到数据固有的规律性

  • 通常一起购买什么产品? 啤酒和尿布?
  • 购买电脑后,以后会购买什么
  • 哪种DNA对新药敏感?

应用

  • 购物篮数据分析,交叉营销,目录设计,促销活动分析,Web日志(点击流)分析和DNA序列分析

频繁模式挖掘为什么重要
频繁模式是数据集的固有和重要属性。

许多基本数据挖掘任务的基础

  • 关联,关联和因果关系分析
  • 顺序结构(例如子图)模式
  • 时空,多媒体,时间序列和流数据中的模式分析
  • 分类:区分性,频繁模式分析
  • 聚类分析:基于频繁模式的聚类
  • 数据仓库:iceberg多维数据集和多维数据集渐变
  • 语义数据压缩:分册
  • 广泛的应用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kxwang_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值