机器学习20:嵌入-Embeddings

本文介绍了嵌入(Embeddings)在机器学习中的重要性,特别是对于协同过滤推荐系统。通过一维和二维空间的示例解释了如何排列电影以捕捉它们的相似性。讨论了稀疏输入数据的问题,如大型网络规模和向量间缺乏有意义的关系,以及如何通过嵌入解决这些问题。Word2vec 和其他降维技术被提及作为获取嵌入的手段,强调嵌入可以帮助捕获语义相似性并在低维空间中表示大型输入数据。
摘要由CSDN通过智能技术生成

嵌入(Embeddings)是一个相对低维的空间,我们可以将高维向量转换到其中嵌入使得对大型输入(例如表示单词的稀疏向量)进行机器学习变得更加容易。理想情况下,嵌入通过将语义相似的输入紧密地放置在嵌入空间中来捕获输入的一些语义。嵌入可以在模型中学习和重用。

1.嵌入:协作过滤的动机

协同过滤 是基于大量其他用户的兴趣来预测目标用户的兴趣的方法之一。在本节,我们以协同过滤算法为例,来看一下电影推荐的实现。假设我们有 500,000 个用户,以及这些用户观看过的电影列表(来自 1,000,000 部电影的目录)。我们的目标是向用户推荐电影。

为了解决这个问题,需要某种方法来确定哪些电影彼此相似。我们可以通过将电影嵌入到一个低维空间中来实现这一目标,如此一来,相似的电影在这个“空间”中应该是邻近的。

在描述如何学习嵌入之前,我们首先

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Jin_Kwok

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值