《Using pseudo-senses for improving the extraction of synonyms from word embeddings》
摘要
我们这次将使用Pseudofit的方法进行同义词的提取。
Pseudofit:specializing word embeddings according to semantic similarity
(word embeddings:词嵌入,把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。简单来说,就是把文本数值化)
1、介绍
(文章简略介绍了很多关于单词嵌入的很多方法,就不讲了)本文使用的是Pseudofit方法,它的原理是exploit the notion of pseudo-sense coming from word sense disambiguation for building representations accounting for distributional variability and to create better word embeddings by bringing these representations closer together. (利用词义消歧产生的伪意义概念来构建表示,并通过将这些表示更紧密地结合在一起来创建更好的词嵌入。)
2、方法
Pseudofit