模型结构:
相关度计算:
query和doc语义向量的余弦距离: R ( Q , D ) = cos ( y Q , y D ) = y Q T y D ∣ ∣ y Q ∣ ∣ y D ∣ ∣ R(Q,D)=\cos(y_Q,y_D) = \frac{y_Q^{\mathrm{T}}y_D}{||y_Q|| y_D||} R(Q,D)=cos(yQ,yD)=∣∣yQ∣∣yD∣∣yQTyD
损失函数:
softmax计算后验概率: P ( D ∣ Q ) = e x p ( γ R ( Q , D ) ) ∑ d i ∈ D e x p ( γ R ( Q , D ) ) P(D|Q) = \frac{exp(\gamma R(Q,D))}{\sum_{d_i \in D} exp(\gamma R(Q,D))} P(D∣Q)=∑di∈Dexp(γR(Q,D))exp(γR(Q,D))
L ( Λ ) = − log ∏ ( Q , D + ) P ( D + ∣ Q ) L(\Lambda) = - \text{log} \prod_{(Q,D^+)} P(D^+|Q) L(Λ)=−log(Q,D+)∏P(D+∣Q)
相似Query 推荐
通过用户的搜索Query和曝光点击商品的日志,使用双向LSTM网络把Query和商品title表征成语义向量。最后只使用Query的向量,计算Query距离最接近的Query。