ground_true 为1 的情况:
recall=hit_rate
这时值的计算与你推荐个数多少无关,recall 又叫查全率,只要押中了,那就认为单用户命中率为100%。
precision 和 topk 有关,单个用户为 命中个数/topk,与recall 成正比。
计算平均值时用,命中的用户个数 / 总的用户个数。
ground_truth 为 多个 的情况:
recall:每个用户的命中率为,在你的候选推荐中,命中了多少个。单个用户计算为,命中个数(hitrate)/ 该用户ground_truth个数
precision:为查准率。单个用户计算为 命中个数 / topk .
计算平均值则将所有单个用户相加 / user总个数
实现:
def precision_at_k_per_sample(actual, predicted, topk):
num_hits = 0
for place in predicted:
if place in actual:
num_hits += 1
return num_hits / (topk + 0.0)
# 一个准确率是,推荐的命中个数/topk