语义相关app搜索(二) 论短文本相似——qjzcy的博客

语义相关app搜索(二) 论短文本相似——qjzcy的博客

App相似,其实是短文本相似的一种,如何在词和文本重合之外找到两个短语的相似呢?这里对我工作中用到短文本相似方法做个归纳,大概有这么几种方法
1、 Session相关法
2、 句子向量法
3、 多级的跳转法
4、 算法模型法


分别举例子吧
一、Session相关法
思路是用户在一个会话中替换的词基本会有某些语义相关,那么我们把这些session找到,可以提炼出相似的短文本有那些共同,如下图为在搜索query中找到的相似短语
这里写图片描述
二、句子向量法
和词向量空间一样,如果我们能够把句子用某种方式表达成向量,就可以用向量求距离
比如我们可以把搜索中query点击过的网址哈希值作为向量,如图,当然不仅限于网址,只要我们能把句子表示为某种向量,就可以用这种方法。
这里写图片描述
三、多级的跳转法
比如,搜索app的query为“交友”,我们通过简单词重合可以找到“秘密交友”,再通过“秘密交友”,找到“秘密花园”。实践中我感觉一级跳转的效果比较好,二级以上跳转的发散度有点大。
四、模型求解法
最近很多流行的算法都在尝试用深度学习的方法来解决短文本相似的问题,这里有我做的几个小例子
深度学习在短文本相似中的应用(Sentence2Vector)
利用lstm模型实现短文本主题相似

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值