G. 知识图谱 语义搜索
概述
- 语义搜索基本框架
- 语义模型
- 数据来源包括 知识表示 和 文档表示
- 语义搜索
- 查询构建
- 关键词
- 表单
- 自然语言
- 形式化语言
- 查询处理
- IR-style匹配和排序
- DB-style精确匹配
- KG-style匹配和推理
- 结果展示
- 查询可视化
- 文档和数据展示
- 概要
- 查询优化
- 隐式反馈
- 显式反馈
- 激励
- 查询构建
- 语义模型
结构化的查询语言 – SPARQL
语义数据搜索
- 有效地对整个web进行精准的语义搜索面临如下挑战
- 可扩展性:对数据Web的有效利用要求基础架构能在大规模和不断增长的内链数据上扩展和应用
- 异构性:主要包括 -
- 如何进一步整合资源
- 如何从不同的数据源中找到与查询相关的数据
- 如何合并来自不同数据源的查询结果
- 不确定性:用户实现不能准确地了解自己的需求,所以需求的描述往往不完整
- 搜索引擎案例
- 类型
- 面向本体的搜索引擎:Swoogle,Watson
- 面向实体的搜索引擎:Sigma on Sindice、FalconS
- 面向细粒度数据Web的搜索引擎:SWSE、Hermes
- 搜索引擎的基本组成
- 三元组存储
- 索引构建
- 查询处理和排序
- 类型
语义搜索的交互范式
- 基于关键字的知识图谱语义搜索方法
- 基于关键词直接在知识图谱上搜索答案
- 核心思想:采用知识图谱子图定位的策略
- 基本流程
- 建立有效的关键词和知识图谱子图的索引,常见的索引方式有:
- 关键词倒排索引
- 摘要索引
- 路径索引
- 对于给定的关键字查询,首先在索引上匹配得到候选的知识图谱子图,进而实现对搜索空间的剪枝
- 在小范围的知识图谱子图上进行搜索,找到最终的查询结果
- 建立有效的关键词和知识图谱子图的索引,常见的索引方式有:
- 基于关键词生成结构化的查询
- 步骤
- 关键词映射:语义处理
- 候选结构化查询构建
- 候选结构化查询排序
- 步骤
- 基于关键词直接在知识图谱上搜索答案
- 基于分面的知识图谱语义搜索
- 基于表示学习的知识图谱语义搜索
- 基于表示学习的结构化语义查询
- 基于表示学习的自然语言语义查询