读《Computing Semantic Relatedness using Wikipedia-based Explicit Semantic Analysis》

本文探讨了基于维基百科的显性语义分析(ESA)方法,旨在解决如何用自然概念表示文本语义及统一处理不同长度文本的问题。通过与词包法、词典和潜在语义分析的对比,显示ESA的优势。ESA将文本映射到加权的维基概念向量,利用机器学习构建的‘语义解释器’实现这一目标,其过程类似信息检索,但检索出的是易于理解的概念。
摘要由CSDN通过智能技术生成


标题和摘要

        先对本文题目做一个翻译,按照文献惯有“基于……”的命名模式,可翻译为:基于维基百科显性语义分析法的语义相关度计算。本文是ESA的集大乘者Gab(Evgeniy Gabrilovich)和另一学者合作完成的一篇文献。这个题目看完后有个小疑问,因为之前看过的诸多文献,我形成了先入为主的观点,ESA本身就是研究语义相关的,或者说这个方法的流程以及最后的结果都是得到语义相关度。而这个标题却告诉我的是,ESA可认为是一个底层的方法,这里具体应用在语义相关度的计算中。

        摘要部分5句话对ESA的背景、ESA的基本原理、实现方法、评价方法、结果对比做了简要的概括。这里挑选有代表性的几句做一个翻译。

        1. 自然语言中语义相关性的计算依托于大量的常识以及专业领域内知识;

        2. ESA这种全新的方法,将文本的语义表征在一个从维基中抽取的高维概念空间中。

要解决的问题

        通篇看完后,发现本文的重点不是在计算语义相关度上面,要解决的问题恰恰是关于ESA这个方法本身,语义相关度计算只是在这里做一个比较的平台,把各种方法应用在这个具体的例子中,加以对比衬出ESA的可行和优势之处。在反观引言部分,这一点就更为清晰,因为在本文,作者要解决三个问题:

        1. 详细介绍ESA如何用维基中的自然概念表示自然语言文本的语义;

        2. 提出一种统一的方法,适用于单个词汇和任意长度文本;

        3. 评价本方法的结果有效性,对比证明ESA优于已有的方法。

相关工作

“老三对”<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值