DSSM:深度语义模型

  • 概述:隐式语义模型将query与document映射到低维空间,把二者的相关性问题转化为低维空间向量的距离。DSSM使用深度结构实现此映射过程,同时提出word hashing技术使得模型适用于大规模数据
  • 经典的隐式语义模型:
1)无监督,目标函数与评价指标耦合关系较弱,效果不佳
1.latent semantic analysis: 对document-term利用SVD进行分解,映射doc或term到低维空间
2.probabilistic latent semantic analysis
3.latent dirichlet allocation
2)拓展隐式语义模型:利用用户点击数据
1.Bi-Lingual Topic Models: 生成模型
2.Discriminative Projective Mdoels:使用S2Net算法进行学习
3)拓展隐式语义模型:利用自动编码器,生成模型
  • DSSN模型:
1)结构:
2)计算:
3)DSSM模型学习过程:
1.给定query时点击文档的后延概率:
2.最小化目标函数:D+正样本、随机采样未点击D-负样本
4)word hashing: 解决term vector太大问题,对bag-of-word向量降维
 
1.方法:以单词good为例,先为其添加起止符号为#good#,然后拆分为n-gram,典型的trigrams为(#go,goo,ood,od#),最后单词被表示为n-gram字符的向量
2.优点:将低term vector的维度
3.不足:碰撞问题
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
posted on 2018-07-24 14:53 bytedance 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/bytedance/p/9359941.html

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值