最近读到推荐系统中的TopN推荐,它的预测准确率一般是通过准确率和召回率来进行评估的,那么我们就要理解,什么是准确率,什么是召回率!
准确率,顾名思义,就是准确程度。通过正确数/总数得到。而正确数是什么,总数是什么呢?
召回率,我们可以理解为找到的数目与总的需要我们找到的数目的比,那在推荐系统中,什么是找到的数目,什么是需要我们总的找到的数目呢?
令R(u)表示在根据训练数据给用户做出的推荐列表,T(u)表示用户根据测试数据给用户做出的推荐列表,则
召回率:
准确率:
精确率是针对我们 预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。
而 召回率是针对我们 原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。
其实就是分母不同,一个分母是预测为正的样本数,另一个是原来样本中所有的正样本数。但分子都是表示预测的正样本与原来正样本的交集。
在信息检索领域,精确率和召回率又被称为查准率和查全率,
查准率=检索出的相关信息量 / 检索出的信息总量
查全率=检索出的相关信息量 / 系统中的相关信息总量