一、亮点
- DSSM是Deep Structured Semantic Model的缩写,即我们通常说的基于深度网络的语义模型,其核心思想是将query和doc映射到到共同维度的语义空间中,通过最大化query和doc语义向量之间的余弦相似度,从而训练得到隐含语义模型,达到检索的目的。
- 为了处理大型词汇表,提出了word hashing方法,query或document的高维term向量被投影到低维的基于n-gram的向量,而信息损失很小。
二、模型结构
DNN的输入是一个高维的term向量(例如,query或者document中未经标准化的term的原始计数),DNN的输出是低维的语义特征空间中的concept vector。
通常, x用来表示输入的term向量, y表示输出向量, l i l_{i} li