TP:预测为正,实际为正
FP:预测为正,实际为负
TN:预测为负,实际为负
FN:预测为正,实际为负
T:true;F:false.即预测结果的真假
P:positive;N:negative.即正样本和负样本
精准率(precision/accuracy)(查准率):TP/(FP+TP)
意义:
预测为正的样本中真正为正的样本所占的比例
推荐的产品有多少都是用户想要的
召回率(call)(查全率):TP/(TP+FN)
意义:
实际为正的样本被正确预测的概论
用户想要的产品被推荐的够不够全
混淆矩阵
ROC
AUC
roc曲线与坐标轴围成的面积
简单算法
NDCG@K(Normalized Discounted Cumulative Gains)归一化累计折损收益
CG:
累计收益
DCG:
累计收益+顺序
分数高+排名前:DCG得分高(实至名归)
IDCG:
理想顺序下的DCG:即得分高的排名也靠前
NDCG@K:
归一化的DCG,便于跨数据集比较
0<NDCG@K<1
注意:K:需要评估前k个item
MRR(Mean Reciprocal Rank)
正确检索结果值在检索结果中的排名来评估检索系统的性能。
ranki:推荐序列中第一个推荐正确的item的排名