推荐系统原理与应用-CSDN博客

本文链接：https://blog.csdn.net/weixin_44690183/article/details/106121321

实验方法：

离线实验：即收集用户行为数据集，并分为训练集和测试集，在训练集上训练用户兴趣模型，在测试集上进行预测——通过事先定义的离线指标评测算法在测试集上的预测结果。缺点是无法获得很多商业上关注的指标，比如点击率、转化率等。
用户调查：即调查问卷。缺点是不一定找得到足够的和可靠的用户、数据难以在短时间收集到。
在线AB测试：即分成不同的组进行对照试验。缺点是数据难以在短时间收集到。
一般要通过离线实验证明很多离线指标优于现有算法；
调查问卷证明用户满意度不低于现有算法(准确度高不一定满意度高；
通过在线的AB测试确定其商业指标优于现有算法；

评测指标：主要有预测准确度(评分预测、topN推荐)、覆盖率、多样性、新颖性、惊喜度、用户满意度、信任度、实时性、健壮性、商业目标等。有些可以定量计算，有些则只能定性描述。

预测准确度：即通过用户以往对于各种商品的评分，来获得用户的兴趣模型，然后==预测用户看到一个没有评过分的物品时会给多少分。评分预测准确度通过均方根误差RMSE和平均绝对误差MAE计算。

$RMSE=\sqrt{ \frac{ \sum_{r,i\in T}(r_{ui}-\hat{r}_{ui}) }{|T|} } $

$ MAE=\frac{ \sum_{u,i \in T}|r_{u,i}-\hat{r}_{u,i}| }{|T|} $

$r_{ui} $是用户 u 对商品 i 的实际评分，$ \hat{r}_{ui} $这是推荐算法的预测评分。

topN推荐即网站推荐给用户的推荐列表，一般通过准确率precision/召回率recall 度量。公式如下：

$ Recall=\frac{ \sum_{u \in U}|R(u)\cap T(u)| }{ \sum_{u \in U}|T(U)| } $

$ Recall=\frac{ \sum_{u \in U}|R(u)\cap T(u)| }{ \sum_{u \in U}|R(u)| } $

其中 R(u)是根据用户在训练集上的行为给出的推荐列表， T(u) 是根据用户在测试集上的行为给出的推荐列表。