标题
基于ESA的自动文摘算法,单从论文标题可以看出是ESA作为一种工具在“自动文摘”领域中的具体应用,就同《基于显性语义分析的专家相似度研究》一样是在“专家检索”中的应用。所以很好奇想通过比较,探究一下ESA的core在哪,ESA的外延又怎么应用。
解决什么问题
在摘要和概要中,作者表明本文要解决的是限定在医药学领域范围内,用ESA方法对文章进行自动文摘采集,便于数字图书馆的文献检索。同时要设计出实现的算法,并以数学公式或伪代码的方式表达出。
相关工作
概念空间
语义表示是自然语言处理的核心问题,也就是一个词语要通过某种抽象,以便计算机或程序能处理,而同时尽量反应出其本有的知识背景。ESA借助维基百科中的内容,对词语的语义构建一个概念空间的向量表示,以保证其可读性,即知识背景。维基百科中,每个词条包含了一个特定的主题,可以看做是一个概念;同时词条中的文本内容由该主题下许多词语构成,词语之间、词语和概念之间存在的关系需要由某种模型进行抽象。在ESA方法中,以“概念”为列,以“词语”为行构建概念空间矩阵,在概念空间中,概念抽象成“坐标轴”,即一个