机器学习推荐系统常见指标计算

最新推荐文章于 2022-03-10 15:57:13 发布

做人要有比数

最新推荐文章于 2022-03-10 15:57:13 发布

阅读量932

点赞数

分类专栏： ML 文章标签：机器学习数据分析大数据

本文链接：https://blog.csdn.net/ch_609583349/article/details/104931306

版权

ML 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

文章目录

机器学习常见指标计算

Precision 、Recall 和F1 Score

精确率（Precision）和召回率（Recall）是机器学习中最常见的评估两个分类模型性能的指标。

	预测为正	预测为负
实际为正	TP(真正例)	FN(假反例)
实际为负	FP(假正例)	TN(真反例)

$\frac{TP}{TP+FP}$
$\frac{TP}{TP+FN}$
然而两个这指标是一对矛盾的指标，一般在不同的应用场景会关系不同的指标。F1 Score是基于Precision和Recall的调和平均：
$\frac{1}{F1} = \frac{1}{2}(\frac{1}{Precision}+\frac{1}{Recall})$

AUC 和 ROC

ROC曲线的横轴为假正例率FPR，表示的含义是：所有真实类别为0的样本中，预测类别为1的比例。
纵轴为真正例率TPR，表示的含义是：所有真实类别为1的样本中，预测类别为1的比例。
两者计算方式如下：
$\frac{FP}{TN+FP}$
$\frac{TP}{TP+FN}$
可以看到TPR=Recall，ROC曲线图绘制如下：
在这里插入图片描述
首先两个端点的含义：
AUC是ROC曲线下部分的面积。具体含义是任意给一个正类样本和一个负类样本，正类样本的score有多大的概率大于负类样本的score。或者，任意给定一个负样本，所有正样本的score中有多大比例是大于该负类样本的score。
AUC<0.5则意味着该模型总是将正例分类成负例，负例分类成正例。
AUC=0.5意味着该模型随机猜测样本的类别。
AUC>0.5意味着真实类别为1的样本中，预测类别为1的比例总是大于真实类别为0的样本中，预测类别为1的比例。
理想情况下，AUC=1，也就是说每个正类都被正确分类。
AUC的优点在于：AUC的计算方法同时考虑了分类器对于正例和负例的分类能力，在样本不平衡的情况下，依然能够对分类器作出合理的评价。

假设正样本1个，负样本99个，如果使用Precision作为评测指标，那么即使全部预测为负样本的情况下，Precision=0.99；如果选择F1 score 作为评测指标那么，F1 score=0;

推荐系统常见指标计算

HR 和 NDCG

这两个指标常见于Top-n推荐。一般都是计算在前n个推荐物品中的指标值，比如HR@n表示推荐的n个物品中命中的物品除以测试集中对应user的物品数量。
Hit Ratio和Recall是一样计算的，对推荐物品的位置不敏感。
归一化折损累积增益(Normalized Discounted Cumulative Gain)对推荐物品位置敏感，计算方式如下：
$\frac{DCG@n}{IDCG}$
$\sum_{i=1}^{n}\frac{2^{rel_{i}}-1}{log_{2}(i+1)}$
其中 $rel_{i}$ 表示是第i个物品的相关性，一般相关的记为1，不相关的记为0。IDCG是所有推荐物品和测试集中物品都相关的条件下的DCG的值，显然是用来做归一化处理的。下面举个例子计算：
假设推荐物品top-5为[3，4，6，9，1]，而测试集中的物品为[8，6，4]，那么：
DCG@5 = $\frac{2^0-1}{log_{2}(1+1)}+\frac{2^1-1}{log_{2}(2+1)}+\frac{2^1-1}{log_{2}(3+1)}+\frac{2^0-1}{log_{2}(4+1)}+\frac{2^0-1}{log_{2}(5+1)}=1.13$
IDCG= $\frac{2^1-1}{log_{2}(1+1)}+\frac{2^1-1}{log_{2}(2+1)}+\frac{2^1-1}{log_{2}(3+1)}+\frac{2^1-1}{log_{2}(4+1)}+\frac{2^1-1}{log_{2}(5+1)}=2.948$
因此NDCG@5=0.383。
可以看出排序位置越靠前NDCG值越大。

MRR

平均倒数排序(Mean Reciprocal Rank)计算的是对用用户i，推荐列表中第一个用户感兴趣的物品的位置的倒数：
$\frac{1}{N}\sum_{1}^{N}\frac{1}{rank_{i}}$
其中N代表用户的个数。比如系统只有一个用户，现在给用户推荐了3个物品[movie1,movie2,movie3]，用户感兴趣的是movie3，那么 $\frac{1}{3}$ 。

MSE、 RMSE和MAE

这些指标常见于回归预测模型，同时也是推荐系统中评分预测的指标。均方误差（Mean Square Error）是预测值和真实值之差的平方的期望值：
$\frac{1}{N}\sum_{i=1}^{N}(y-\hat y)^{2}$
均方根误差（Root Mean Square Error）其实就是MSE的平方根：
$\sqrt{\frac{1}{N}\sum_{i=1}^{N}(y-\hat y)^{2}}$
平均绝对误差（Mean Absolute Error ）是预测值和真实值之差的绝对值的期望值：
$\frac{1}{N}\sum_{i=1}^{N}|y-\hat y|$

做人要有比数

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习推荐系统常见指标计算

文章目录机器学习常见指标计算Precision 、Recall 和F1 ScoreAUC 和 ROC推荐系统常见指标计算HR 和 NDCGMRR 和 MAPMSE、 RMSE和MAE机器学习常见指标计算Precision 、Recall 和F1 Score精确率（Precision）和召回率（Recall）是机器学习中最常见的评估一个分类模型性能的指标。预测为正预测为负...
复制链接

扫一扫