基于内容的推荐

最新推荐文章于 2024-05-13 07:45:00 发布

superyoungchaos

最新推荐文章于 2024-05-13 07:45:00 发布

阅读量6.4k

点赞数

分类专栏： Web 文章标签：文档

Web 专栏收录该内容

5 篇文章

订阅专栏

基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤，所谓的基于内容的推荐方法就是根据用户过去的浏览记录来想用户推荐用户没有接触过的推荐项。下面主要是从两个方面来说基于内容的推荐方法：启发式的方法和基于模型的方法。

启发式的方法就是用户凭借经验来定义相关的计算公式，然后再根据公式的计算结果和实际的结果进行验证，然后再不断的是修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集，然后根据这个数据集来学习出一个模型。一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算，跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征，并使用这些关键字作为描述用户特征的向量；然后再根据被推荐项的中的权重高的关键字来作为推荐项的属性特征，然后再将这个两个向量最相近的（与用户特征的向量计算得分最高）的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时，一般使用的是cosine方法，计算两个向量之间夹角的cosine值。

对于基于模型的方法来推荐时，常常是使用纯贝叶斯分类的方法来实现，其主要思想就是首先对用户的过去访问记录进行分类，找出用户比较喜欢的分类，然后再将被推荐项进行分类，将与用户比较喜欢的分类的推荐项推荐给用户。对于网页Pj个网页中的关键字 $k_{1,j} cdots k_{n,j}$ 计算这个网页属于列别Ci，根据纯贝叶斯分类计算则有： $P(C_{i} delim{|} k_{1,j} cdots &k_{n,j})~~~~delim{[}{1}{]}$ 再假设这些关键字是独立的且这些关键字在文档或者是句子中的位置也是独立的，从而可以将公式[1]化简成 $P(C_{i})prod{x}{}{P(k_{x, j}delim{|}C_{i}})~~~~delim{[}{2}{]}$ ，然后再根据用户过去的访问记录计算出 $P(C_{i})$ 和 $P(k_{x,j})delim{|} C_{i})$ 值。
基于内容的推荐能很好的根据用户的过去的访问记录来给用户做推荐，但是基于内容的推荐还是存在局限性的：