07-01 推荐系统常用度量指标

最新推荐文章于 2023-12-06 18:26:55 发布

小猿取经-Egon林海峰

最新推荐文章于 2023-12-06 18:26:55 发布

阅读量887

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_46032351/article/details/104626050

版权

机器学习专栏收录该内容

90 篇文章 8 订阅

订阅专栏

文章目录

推荐系统常用评估指标
RMSE
MAE
Precision(准确率)&Recall(召回率)
覆盖率
信息熵
基尼系数
多样性
获取各种评测指标的途径
长尾分布

RMSE

加大了对预测不准的用户物品评分的惩罚。

$\text{RMSE}=\sqrt\frac{\sum_{u,i\in{T}}(r_{ui}-\hat{r_{ui}})^2}{|T|}$

# records[i] = [u,i,rui,pui] # rui是用户u对物品i的实际评分，pui是用户u对物品i的预测评分

def rmse(records):
    """计算均方根误差"""
    
    return math.sqrt(sum([(rui-pui)*(rui-pui) for u,i,rui,pui in records])/len(records))

MAE

如果评分系统是基于整数建立的，对预测结果取整会降低MAE的误差。

$\text{MAE}=\frac{\sum_{u,i\in{T}}|r_{ui}-\hat{r_{ui}}|}{|T|}$

# records[i] = [u,i,rui,pui] # rui是用户u对物品i的实际评分，pui是用户u对物品i的预测评分

def mae(records):
    """计算平均绝对误差"""
    
    return math.sqrt(sum([abs(rui-pui) for u,i,rui,pui in records])/len(records))

Precision(准确率)&Recall(召回率)

$\text{Precision}=\frac{\sum_{u\in{U}}|R(u)\bigcap{T(u)}|}{\sum_{u\in{U}}|R(u)|}$
其中 $R (u)$ 是用户在训练集上的行为给用户作出的推荐列表。

$\text{Recall}=\frac{\sum_{u\in{U}}|R(u)\bigcap{T(u)}|}{\sum_{u\in{U}}|T(u)|}$
其中 $T (u)$ 是用户在测试集上的行为给用户作出的推荐列表。

def precision_recall(test, N):
    """
    计算准确率和召回率
    test: 
    N: 推荐列表长度
    """
    hit = 0
    n_recall = 0
    n_precision = 0

    for user, item in test.items():
        rank = Recommend(user, N)
        hit += lenn(rank & itmes)
        n_recall += len(items)
        n_precision += N

    return [hit/(1.*n_recall), hit/(1.*n_precision)]

覆盖率

覆盖率描述一个推荐系统对物品长尾的发掘能力。

$\text{Coverate}=\frac{|\bigcup_{u\in{U}}R(u)|}{I}$
其中 $R (u)$ 是推荐系统给每个用户推荐一个长度为 $N$ 的物品列表。

信息熵

信息熵可以定义覆盖率。

$H=\sum_{i=1}^np(i)\log{p(i)}$
其中 $p (i)$ 是物品 $i$ 的流行度除以所有物品流行度之和。

基尼系数

基尼系数可以定义覆盖率。基尼系数也可以查看推荐系统算法是否具有马太效应（流行更流行，不流行更不流行）。

$G=\frac{1}{n-1}\sum_{j=1}^n(2j-n-1)p(i_j)$
其中 $i_j$ 是按照物品流行度 $p$ 从小到大排序的物品列表中的第 $j$ 个物品。

def gini_index(p):
    """计算基尼系数"""
    j = 1
    n = len(p)
    G = 0
    
    for item, weight in sorted(p.items(), key=itemgetter(1)):
        G += (2*j-n-1)*weight

    return G / float(n-1)

多样性

多样性描述了推荐列表中物品两两之间的不相似性。

$\text{Diversity}(R(u))=1-\frac{\sum_{i,j\in{R(u)},i\neq{j}}s(i,j)}{\frac{1}{2}|R(u)|(|R(u)|-1)}$
其中 $R (u)$ 为用户 $u$ 的推荐列表， $s(i,j)\in[0,1]$ 定义了物品 $i$ 和物品 $j$ 之间的相似度。