- 博客(1)
- 收藏
- 关注
原创 FP增长算法
寻找频繁项是数据挖掘中一个常见问题。比如上图中,输入【数据挖掘】,搜索引擎会自动显示【工具】这个词汇,{数据挖掘,词汇}是搜索引擎记录的频繁项集。{啤酒,尿布}是交易记录中的频繁项集。 对于频繁的定义,一般用【支持度】这个概念,表示数据集中包含某一项的比例。其计算非常简单 在给定数据集中,找出所有满足支持度阈值的项集,很容易想到用暴力搜索来解决问题。但是暴力搜索的时间代价是难以接受的。对于有n个商品的商店,其所有商品的可能组合共...
2021-12-22 22:44:37 2298
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人