机器学习项目(五) 电影推荐系统(三)

四、基于内容推荐

协同过滤:基于内容 基于用户
找到用户或内容之间的相似性 进行推荐

基于内容推荐简介

基于标的物相关信息、用户相关信息及用户对标的物操作行为来构建推荐算法模型,为用户提供推荐服务。
在这里插入图片描述

基于内容推荐

核心步骤
# 插图

基于用户特征和标的物特征 实现为用户推荐相似的标的物

1.基于用户历史行为记录做推荐:先计算标的物之间的相似性,然后利用用户历史记录中与标的物相似的物品进行推荐(余弦相似度)
2.基于显示的标签标示做推荐:根据用户的标签,表示用户的兴趣,标签可以关联许多的标的物
3.基于向量相似做推荐:将用户和标的物 嵌入向量空间中,找到用户和标的物之间的相似性。计算用户和标的物之间的相似性。

用户特征表示方法

1.用户行为记录作为显示特征:过去一段时间,用户对商品的偏好
2.显示的标签特征:标的物是由很多标签表示的,这些标签又可以表征这些标的物,用户画像也可以基于用户对标的物打上对应的标签
3.向量式的兴趣特征:基于标的物的信息,将标的物嵌入到向量当中,利用向量来表示标的物,有了标的物的向量化之后,用户的兴趣向量就可以用其他操作过的标的物的向量的平均向量来表示,所有的标的物的向量化之后,用户的兴趣向量能够表示出来
4.通过交互方式获取用户兴趣标签:很多APP在注册的时候让用户选择自己的用户标签,一旦用户选择了自己的兴趣标签,就为推荐系统提供了推荐的原材料,具体是与向量的兴趣特征类似,计算对标的物的偏好程度,根据偏好度去进行推荐
5.用户的人口统计学特征:用户在注册或登录平台的时候提供了相关的信息,通过运营用户填写的信息,利用算法推断出一些结论,用户年龄,性别,地域输入,爱好,居住地等,计算用户之间的相似度,从而对用户做推荐

商品特征表示

四大表示方法

1.标签信息:标的物可以用隐式向量、显式标签表示,标的物可以看做多维向量,利用one-hot编码来描述标的物的信息
2.结构化信息:变成向量化,然后将商品特征进行表示
3.包含文本信息的标的物的特征表示:将文本中的信息进行向量化,提取一些关键字、关键词、主题等(TFIDF、IDA),然后计算文本的相似程度(Doc2vec、word2vec)
4.包含图片、音频、或者视频信息的特征表示:利用包含文本的信息进行特征表示,利用图像、音频等领域的技术将特征进行提取

相似度衡量

1.余弦相似度
2.喜好度
3.最近邻方法
4.聚类

余弦相似度

cos ⁡ ( θ ) = A ∗ B ∥ A ∥ ∗ ∥ B ∥ = ∑ i = 1 n A i ∗ B i ∑ i = 1 n ( A i ) 2 ∑ i = 1 n ( B i ) 2 \cos (\theta)=\frac{A^{*} B}{\|A\|^{*}\|B\|}=\frac{\sum_{i=1}^{n} A_{i}{*} B_{i}}{\sqrt{\sum_{i=1}^{n}\left(A_{i}\right)^{2}} \sqrt{\sum_{i=1}^{n}\left(B_{i}\right)^{2}}} cos(θ)=

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
项目完整可用,配合压缩包内数据库可直接运行使用。 eclipse+mysql5.7+jdk1.8 功能:推荐引擎利用特殊的信息过滤(IF,Information Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。参考特征的选取可能是从项目本身的信息中提取的,或是基于用户所在的社会或社团环境。 根据如何抽取参考特征,我们可以将推荐引擎分为以下四大类: • 基于内容的推荐引擎:它将计算得到并推荐给用户一些与该用户已选择过的项目相似的内容。例如,当你在网上购书时,你总是购买与历史相关的书籍,那么基于内容的推荐引擎就会给你推荐一些热门的历史方面的书籍。 • 基于协同过滤的推荐引擎:它将推荐给用户一些与该用户品味相似的其他用户喜欢的内容。例如,当你在网上买衣服时,基于协同过滤的推荐引擎会根据你的历史购买记录或是浏览记录,分析出你的穿衣品位,并找到与你品味相似的一些用户,将他们浏览和购买的衣服推荐给你。 • 基于关联规则的推荐引擎:它将推荐给用户一些采用关联规则发现算法计算出的内容。关联规则的发现算法有很多,如 Apriori、AprioriTid、DHP、FP-tree 等。 • 混合推荐引擎:结合以上各种,得到一个更加全面的推荐效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值