最近在调研给定一个用户,如何高效找到与该用户相似的其他用户,即相似用户查找 (lookalike), 在网上做了些调研,希望和大家分享一下,当前阶段的一些调研结果。
当前普遍通过笛卡尔距离(Jaccard Distance), 余弦距离(Cosine Distance), 编辑距离(Edit Distance)和汉明距离(Hamming Distance)等来量化两个实体之间的相似度,以下简单介绍以上几个概念:
最近在调研给定一个用户,如何高效找到与该用户相似的其他用户,即相似用户查找 (lookalike), 在网上做了些调研,希望和大家分享一下,当前阶段的一些调研结果。
当前普遍通过笛卡尔距离(Jaccard Distance), 余弦距离(Cosine Distance), 编辑距离(Edit Distance)和汉明距离(Hamming Distance)等来量化两个实体之间的相似度,以下简单介绍以上几个概念: