关于FPGrowth和Jaccard距离的思考

目的:计算视频A和视频B的相似度。

采用Jaccard距离计算就是Num(A∩B)/Num(A∪B),假设在计算的样本集中A和B出现的次数很多,那么结果基本接近1,在视频推荐中,会让很热,曝光很多的视频继续曝光。

采用关联规则来分析,只取出A->B这种简单的规则。同样,当A在训练集中出现的次数很大,B在训练集中出现的次数很小时,在支持度这一步就很容易将B(与B组合的其它项集)pass,但A很多,保留下包含A的频繁项集就很多。那么置信度这一步无论取多少,B都很难出现。所以觉得这种方式适合推荐一些主推产品。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值