SPARK: Adapting Keyword Query to Semantic Search-ISWC2007

1.主要工作
给出一个关键词,把关键词转换成一系列按照概率排序的 SPARQL 语句输出出来。
2.主要步骤

  主要有三个步骤:术语匹配、查询图的构造、和查询排序。

2.1术语匹配:把关键词和知识库中的资源进行匹配。方法:形态学匹配(子串,缩写等)、语义匹配(近义词)。

2.2查询图的构造:把匹配上的资源链接起来,这样丢失的关系和概念就可以被找回,从而构造一个完整的查询图;利用第一步返回的那些资源项用最小生成树的方法来构造。

2.3基于概率的查询排序:从所有返回的的查询中查找用户最可能需要的查询。由以下公式可知,事件F在事件D和K同时发生的条件下发生的概率,正比于事件F在D发生的条件下发生的概率和事件F在K发生的条件下发生的概率(其实就是两次贝叶斯公式展开)。


     于是我们定义了两种概率来进行查询排序。KQM:临近匹配概率和反馈概率。KBM:信息量、事件发生的概率。

3.算法流程

    用户输入一个关键词,术语匹配用一组匹配算法从知识库中找到关键词的匹配,然后查询图构造阶段把所有的查询词利用最小生成树算法来构造查询图,最后在查询排序阶段评估两个项KQM和KBM,返回一系列按照概率大小排序的SPARQL语句。


注:本文的spark不是现在通用的spark计算框架。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值