前段时间对推荐系统很感兴趣,所以拿到了这本书,几乎都是用碎片时间阅读的,所以大概看了两个多月。
因为没有看过推荐系统其他的书,所以无法横向评价,但对于一个认知为零的人,从该书中受益还是很大的。
这本书讲的东西比较全,也很贴切实际。整本书篇幅不多,200页出头,很适合我这样的初学者,作为知识了解阶段的读物。
开篇就是介绍推荐系统的概念和应用范围。
第二章 利用用户行为数据。
介绍,如何利用用户的行为进行推荐,设计实验时要分为训练集和测试集,要多次划分,多次测试,求平均值。评测指标包括准确度、覆盖度、新颖度、流行度。例如用户活跃度和物品活跃度。介绍了基于用户的协同过滤算法,和基于物品的协同过滤算法。隐语义模型:用于根据行为自动分类事物。这里面也包括了如何找到负样本。基于图的模型:该模型先画出人物和物品的连接图,再使用随机游走算法PersonalRank,根据节点被访问的概率,来进行预测打分。
第三章 推荐系统的冷启动问题
这章介绍了如何在缺少历史数据的情况下,尽量保证推荐效果,这里面讲的也就是利用静态信息,例如注册信息,