离线评估 offline evaluation
一般包括两个评估任务:评分预测和top n推荐‘
对于评分预测模型:训练数据集训练好数据,测试数据集预测用户对物品的评分。评价指标:MAE和RMSE
其中T表示测试集。
对于Top N模型:对排名进行评估。评价指标:准确率,召回率,F1
假设推荐列表长度为n,用户集合,给用户u推荐的商品集合
,用户u在测试集里实际动过过的物品集合
在线评估 online evaluatuion
A/B test
将用户划分为A,B两组,A实验组用户,接受所设计的推荐算法推荐的商品,B对照组用户,接受基线方法推荐的商品。通过对比两组用户的行为来评估推荐算法的性能。
CTR:用户点击率,通过该算法计算出的被点击的项目占推荐项目总数的百分比
CR:用户转化率,用户购买的项目占被点击的项目的比率。