标题和摘要
先对本文题目做一个翻译,按照文献惯有“基于……”的命名模式,可翻译为:基于维基百科显性语义分析法的语义相关度计算。本文是ESA的集大乘者Gab(Evgeniy Gabrilovich)和另一学者合作完成的一篇文献。这个题目看完后有个小疑问,因为之前看过的诸多文献,我形成了先入为主的观点,ESA本身就是研究语义相关的,或者说这个方法的流程以及最后的结果都是得到语义相关度。而这个标题却告诉我的是,ESA可认为是一个底层的方法,这里具体应用在语义相关度的计算中。
摘要部分5句话对ESA的背景、ESA的基本原理、实现方法、评价方法、结果对比做了简要的概括。这里挑选有代表性的几句做一个翻译。
1. 自然语言中语义相关性的计算依托于大量的常识以及专业领域内知识;
2. ESA这种全新的方法,将文本的语义表征在一个从维基中抽取的高维概念空间中。
要解决的问题
通篇看完后,发现本文的重点不是在计算语义相关度上面,要解决的问题恰恰是关于ESA这个方法本身,语义相关度计算只是在这里做一个比较的平台,把各种方法应用在这个具体的例子中,加以对比衬出ESA的可行和优势之处。在反观引言部分,这一点就更为清晰,因为在本文,作者要解决三个问题:
1. 详细介绍ESA如何用维基中的自然概念表示自然语言文本的语义;
2. 提出一种统一的方法,适用于单个词汇和任意长度文本;
3. 评价本方法的结果有效性,对比证明ESA优于已有的方法。