深度学习之词义搜索和句意表示

第一部分:正则搜索

优点:

匹配精准

代码简洁

缺点:

难以理解语义

可读性差

性能较低

维护困难

灵活性低

(因为组合的形式太繁杂了)

第二部分:词义搜索(解决上面的正则搜索)

(1)基本含义

是一种基于词嵌入的搜索方法,通过计算嵌入之间的相似度,从而找到与目标单词相关的单词。

上图展示的就是将左侧7维的数据映射到二维空间中,从而可以更加直观地看出不同单词之间的关联度强弱

优点:词义搜索能够更加准确地理解文本的内容,无需人工配置规则或者同义词典,就能很好地实现信息的检索。

第三部分:句子向量Doc2vec

我们第二部分说的是词义搜索,现在“句子向量”,在词义搜索任务中,有时候要搜索的并非一个词,而是一个句子段落,或者是文章,我们也可以将这些表示成向量的形式。

句子向量表示的方法:

(1)加权平均法

(2)PV-DM

(3)PV-DBOW

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

还不秃顶的计科生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值