《搜索和推荐中的深度匹配》——经典匹配模型 2.1 匹配学习

小爷毛毛（卓寿杰）

已于 2025-04-02 13:39:55 修改

阅读量1.8k

点赞数

分类专栏：搜索推荐机器学习基础/原理文章标签：学习人工智能

于 2021-05-18 15:23:51 首次发布

本文链接：https://blog.csdn.net/u011239443/article/details/116987231

版权

本文详细介绍了搜索和推荐系统中的经典匹配模型，重点讲解了匹配学习的概念，包括匹配函数和匹配学习函数的定义。匹配函数描述了两个对象之间的匹配程度，而匹配学习通过监督学习来学习这些函数的参数。文中提到了点向、成对和列表损失函数，并探讨了它们在训练过程中的作用。此外，还讨论了匹配学习与排序学习的区别，以及其在信息检索和推荐系统中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

重磅专栏推荐：
《大模型AIGC》
《课程大纲》
《知识星球》

本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和Stable Diffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深入的技术解析和实践经验分享，旨在帮助读者更好地理解和应用这些领域的最新进展

2. 经典匹配模型

已经提出了使用传统的机器学习技术进行搜索中的查询文档匹配和推荐中的用户项目匹配的方法。这些方法可以在一个更通用的框架内形式化，我们称之为“学习匹配”。除了搜索和推荐外，它还适用于其他应用，例如释义，问题解答和自然语言对话。本节首先给出学习匹配的正式定义。然后，它介绍了传统学习以匹配为搜索和推荐而开发的方法。最后，它提供了该方向的进一步阅读。

2.1 匹配学习

2.1.1 匹配函数

匹配问题的学习可以定义如下。假设存在两个空间X和Y。在两个空间 $x \in X$ 和 $y \in Y$ 的两个对象上定义了一个匹配函数 $F = {f（x，y）}$ ，其中每个函数 $f ： X \times Y \to R$ 表示两个对象x和y之间的匹配程度。两个对象x和y及其关系可以用一组特征 $Φ （ x ， y ）$ 来描述。

匹配函数f（x，y）可以是特征的线性组合：
在这里插入图片描述
其中w是参数向量。它也可以是广义线性模型，树模型或神经网络。

2.1.2 匹配学习函数

可以采用监督学习来学习匹配函数f的参数，如图2.1所示。
在这里插入图片描述
监督学习的匹配通常包括两个阶段：离线学习和在线匹配。在离线学习中，给出了一组训练实例 $D = \{ （x_1，y_1，r_1），...，（x_N，y_N，r_N）\}$ ，其中 $r_i$ 是指示对象之间匹配程度的布尔值或实数 $x_i$ 和 $y_i$ ，N是训练数据的大小。进行学习以选择可以在匹配中表现最好的匹配函数f∈F。在在线匹配中，给定一个测试实例（一对对象） $（ x ， y ） \in X \times Y$ ，学习到的匹配函数f用来预测对象对之间的匹配度，表示为 $f （ x ， y ）$ 。

与其他监督学习问题类似，我们可以将学习匹配的目标定义为最小化损失函数，该函数表示匹配函数在训练数据和测试数据上可以达到多少精度。更具体地，给定训练数据D，学习等于解决以下问题：
在这里插入图片描述
目标由两部分组成：经验损失 $L （ D ， f ）$ 衡量匹配函数f对训练数据产生的总损失，而正则化器 $Ω （ f ）$ 防止过拟合训练数据。通常选择 $Ω （ f ）$ 来惩罚f的复杂度。流行的正则化器包括l1，l2以及它们的混合。

经验损失函数 $L （ D ， f ）$ 的不同定义导致不同类型的学习以匹配算法。文献中已广泛使用三种类型的损失函数，分别称为点向损失函数(pointwise loss function)，成对损失函数(pairwise loss function)和列表损失函数(listwise loss function)【1】。接下来，我们简要描述三种类型的损失函数。

Pointwise Loss Function

Pointwise Loss Function 仅在一个实例（即源对象和目标对象）上定义。假设存在一对真正匹配度为r的对象 $（ x ， y ）$ 。此外，假设由匹配模型给出的 $（ x ， y ）$ 的预测匹配度是 $f （ x ， y ）$ 。逐点损失函数定义为表示匹配度之间差异的度量，表示为 $l^{point}（r，f（x，y））$ 。$ f（x，y）$与r越近，损失函数的值越小。