在上一篇文章中,我们介绍了推荐系统的主要工作流程。在接下来的文章中,我们会详细分析推荐系统中的过滤技术。
推荐系统中不同的过滤技术
推荐系统要想为用户提供切实有用的推荐服务,高效、准确的推荐技术至关重要,也就是说,理解不同推荐过滤技术的特征和潜力至关重要。
下图显示了推荐系统中不同的过滤技术:
推荐系统中不同的过滤技术
基于内容的过滤技术(Content-based filtering)
基于内容的过滤技术(CBF)是一种依赖于域的算法,在生成预测时,它更多地强调对项目属性的分析。当被推荐的对象是网页、出版物和新闻等文本型项目时,这种过滤技术是最成功的。
基于内容的过滤技术推荐时要依赖用户画像,而用户画像是从用户评估过的项目中获取,与用户的积极评价最相关的项目会被推荐给用户。
为了生成有意义的推荐结果,CBF会使用不同的模型来查找文本项目之间的相似性。它可以使用向量空间模型( Vector Space Model),如关键词权重计算法(TF / IDF,Term Frequency Inverse Document Frequency),或概率模型,如朴素贝叶斯分类器、决策树、或神经网络,在语料库中模拟不同文本项目之间的关系。之后,通过统