目的:计算视频A和视频B的相似度。
采用Jaccard距离计算就是Num(A∩B)/Num(A∪B),假设在计算的样本集中A和B出现的次数很多,那么结果基本接近1,在视频推荐中,会让很热,曝光很多的视频继续曝光。
采用关联规则来分析,只取出A->B这种简单的规则。同样,当A在训练集中出现的次数很大,B在训练集中出现的次数很小时,在支持度这一步就很容易将B(与B组合的其它项集)pass,但A很多,保留下包含A的频繁项集就很多。那么置信度这一步无论取多少,B都很难出现。所以觉得这种方式适合推荐一些主推产品。