1.评分预测
评分预测主要用来预测用户对item的评分,离线评估主要有RMSE和MAE两种评估方式,它们的计算方式如下
$$RMSE=\frac{\sqrt{\sum_{(u,i)\in T} (r_{ui}-\hat{r}_{ui})^2}}{|T|}$$
$$MAE=\frac{\sum_{(u,i)\in T} |r_{ui}-\hat{r}_{ui}|}{|T|}$$
其中T表示评分记录集合,\(r_{ui}\)表示user对item的实际评分,\(\hat{r}_{ui}\)表示user对item的预测评分。
RMSE 加大了对预测不准的用户物品评分的惩罚(平方项的惩罚),因而对系统的评测更加苛刻。
2.TopN推荐
为用户推荐N个用户可能感兴趣的物品,其离线评估方式有Precision、Recall 、覆盖率、新颖性。
2.1Precision和Recall
$$Precision=\frac{\sum_{u\in U}|R(u)\cap T(u)|}{\sum_{u\in U}|R(u)|}$$
$$Recall=\frac{\sum_{u\in U}|R(u)\cap T(u)|}{\sum_{u\in U}|T(u)|}$$
其中\(R(u)\)表示为用户\(u\)推荐的item集合,\(T(u)\)为用户\(u\)实际有过行为的item集合,precision可以理解为推荐的商品真正为用户有过行为的商品占推荐的总商品的比例,recall可以理解为推荐的商品真正为用户有过行为的商品数目占用户实际有过行为的商品的比例。
2.2覆盖率
$$Coverage=\frac{\sum_{u\in U}|R(u)|}{|I|}$$
其中I表示所有商品的集合,反映了推荐的商品占所有商品的比例,一定程度上反映了系统挖掘长尾的能力。