面向语义对比分析的词嵌入

最新推荐文章于 2024-07-18 15:08:33 发布

黄发良的博客

最新推荐文章于 2024-07-18 15:08:33 发布

阅读量1.1k

点赞数

分类专栏：词向量化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/falianghuang/article/details/72852847

版权

该博客探讨了面向语义对比分析的词嵌入方法，尤其是SCE（Stochastic Contrasting Embedding）。SCE借鉴了SNE的思想，旨在保持词的对比和相似语义邻居在原始和嵌入空间中的分布。文中还介绍了Marginal Contrasting Embedding和Semantic Differential Reconstruction（SDR）两个子方法，用于增强对比语义的表示。

摘要由CSDN通过智能技术生成

文献：Chen Z, Lin W, Chen Q, et al. Revisiting Word Embedding for Contrasting Meaning[C] ACL 2015: 106-115.

基本思想

现有的词嵌入模型都是建立在“分布式语义”的假设之上，即“具有相似上下文的词语具有相似语义”，而语义具有对比意义的不同词往往具有相似的上下文. 因而，这些模型难以胜任语义对比分析的任务。

框架

提出如下框架：

（1）Top Hidden Layer负责将词对比语义的各种嵌入表示（SCE、CRM、SDR）集成；
（2）Contrast Inference Layer 负责嵌入表示： CRM与SDR为现有方法，MCE为本文提出的方法。

对比语义嵌入表示方法SCE

启发于Hinton 提出的随机邻域嵌入(stochastic neighbor embedding, SNE)思想“原始空间与嵌入空间中，目标词的邻居分布大致相同”，本文提出SCE(stochastic constrasting embedding),SCE具有如下特征：

在原始空间与嵌入空间中the distribution of the contrasting “neighbors” to be close to the distribution of the “neighbors”
利用词典中的反义词学习constrasting neighbors
在原始空间与嵌入空间中, 词 $w_k$ 的具有对比语义邻居词语集与具有相似语义邻居词语集大致不变

词 $w_k$ 属于词 $w_i$ 的邻居的概率为： p(wk|wi)=exp(−d2i,k)∑|V|m≠iexp(−d2i,m)<

最低0.47元/天解锁文章

黄发良的博客

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。