【深度学习算法原理】Deep Structured Semantic Models（DSSM）

zhiyong_will

已于 2022-04-24 13:11:44 修改

阅读量3.2k

点赞数 2

分类专栏：深度学习Deep Learning 文章标签：深度学习

于 2019-06-22 15:17:42 首次发布

本文链接：https://blog.csdn.net/google19890102/article/details/80408849

版权

深度学习Deep Learning 专栏收录该内容

79 篇文章 138 订阅

订阅专栏

1. 概述

深度语义模型（Deep Structured Sematic models, DSSM）是在2013年由微软的研究人员提出，主要解决的是在搜索的过程中，对于传统的依靠关键词匹配的方法的弊端（语义上的相似）提出的潜在语义模型。DSSM算法在实际工作中也被证明是卓有成效的算法，不仅在搜索中得到广泛的应用，同时也被使用在推荐系统的召回中。

2. 算法的基本思想

2.1. DSSM的网络结构

DSSM算法的网络结构如下所示：

在这里插入图片描述
从上述的网络结构图中可以看出，DSSM的核心思想是将不同的对象映射到统一的语义空间中，并在该空间中计算对象之间的相似度。在其具体的计算过程包括两个方面：第一，将query和documents映射到同一个低维的向量空间中；第二，利用余弦计算相似性。

首先将query和documents分别表示成向量 $x_Q$ 和 $x_D$ ，在参考文献的论文中，作者针对向量的构建过程给出了一些具体的建议，针对具体的任务可以有选择的采用。得到query和documents的对应向量后，通过深层神经网络将其表示为同一个空间中的向量 $y_Q$ 和 $y_D$ ，即所谓的语义特征（Semantic feature）。具体的计算过程如下所示：

$l_i=f\left ( W_il_{i-1}+b_i \right )$

其中， $W_i$ 是第 $l_i$ 层网络的权重， $b_i$ 是第 $l_i$ 层网络的偏置。 $f$ 是第 $l_i$ 层网络的激活函数。

在得到query和documents的语义特征后，通过cosine计算query和documents之间的相似性：

$R\left ( Q,D \right )=cosine\left ( y_Q,y_D \right )=\frac{y_Q^Ty_D}{\left \| y_Q \right \|\left \| y_D \right \|}$

2.2. DSSM模型的损失函数

假设给定的query为 $Q$ ，document为 $D$ ，那么相似的概率 $P\left ( D\mid Q \right )$ 为：

$P\left ( D\mid Q \right )=\frac{exp\left ( \gamma R\left ( Q,D \right ) \right )}{\sum _{{D}'\in \mathbf{D}}exp\left ( \gamma R\left ( Q,{D}' \right ) \right )}$