领域知识图谱难点统计

对于领域知识图谱的构建,通常的几个步骤如下:知识建模、存储、抽取、融合、计算和应用。
对应到每一个过程的难点有

1)知识建模

  • 建立知识图谱的概念模式的过程,相当于关系数据库的表结构定义。
    a. 概念划分的合理性,如何描述知识体系及知识点之间的关联关系
    b. 属性定义方式,如何在冗余程度最低的条件下满足应用和可视化展现
    c. 事件、时序等复杂知识表示,通过匿名节点的方法还是边属性的方法来进行描述,各自的优缺点是什么
    d. 后续的知识扩展难度,能否支持概念体系的变更以及属性的调整

2)知识存储

  • 针对构建完成的知识图谱设计底层存储方式,完成各类知识的存储,包括基本属性知识、关联知识、事件知识、时序知识、资源类知识等
    a. 单一式存储和混合式存储的优缺点及应用场景
    b. 如何根据业务场景怎样选择知识存储介质(原生图数据库、现有关系型数据库等)

3)知识抽取

  • 从不同来源、不同数据中进行知识提取,形成知识并存入知识图谱的过程。
    a. 对于结构化数据中存在的复杂关系如何进行知识提取
    b. 对于大批量半结构化数据(大量网页)如何进行知识提取
    c. 对于非结构化文本数据的知识提取,如何保证抽取的准确率和覆盖率,如何解决领域训练数据少的问题
    d. 如何解决指代消解、共指消解等歧义问题

4)知识融合

  • 将不同来源的知识进行对齐、合并的工作,形成全局的知识标识和关联。
    a. 进行知识融合时使用什么方式实现不同来源、不同形态知识的融合
    b. 如何对海量知识进行高效融合
    c. 如何对新增知识进行实时融合
    d. 如何进行多语言融合

5)知识计算

  • 领域知识图谱能力输出的主要方式,通过知识图谱本身能力为传统的应用形态赋能,提升服务质量和效率。其中,图挖掘计算和知识推理时最具代表性的两种能力,如何将这两种能力与传统相结合是需要解决的一个关键问题。
    a. 知识推理一般应用于 知识发现、 冲突与异常检测, 是知识精细化工作和决策分析的主要实现方式。 知识推理又可以分为 基于本体的推理 和基于规则的推理。 一般需要依据 行业应用的业务特征进行规则的定义, 并基于本体结构与 定义的规则执行推理过程, 给出推理结果。 关键问题: 大数据量下的快速推理、 记忆对于增量知识和规则的快速加载。
    b. 图挖掘计算指基于图论的相关算法,实现对图谱的探索与挖掘。 图计算能力可辅助传统的推荐、搜索类应用。 KG的图算法一般包括图遍历、最短路径、权威节点分析、族群发现最大流算法、相似节点等。 主要问题: 大规模图上的算法效率。

6)知识应用

  • 将知识图谱特有的应用形态与领域数据和业务场景相结合,助力领域业务转型。知识图谱的典型应用包括语义搜索、智能问答以及可视化决策。
    a. 语义搜索,指基于知识图谱中的知识,解决传统搜索中遇到的关键字语义多样性及语义消歧的难题,通过实体链接实现知识与文档的混合检索。 语义检索 需要考虑如何解决自然语言 输入 带来的 表达多样性问题, 同时需要 解决语言中实体的歧义性问题。
    b. 智能问答,指针对用户输入的自然语言进行理解,从知识图谱或目标数据中给出用户问题的答案。关键技术和难点:准确的语义解析,如何正确理解用户的真实意图;对于返回的答案,如何评分以确定优先级顺序。
    c. 可视化决策,指通过统一的图形接口,结合可视化、推理、检索等,为用户提供信息获取的入口。对于可视化决策支持,需要考虑的关键问题包括:如何通过可视化方式辅助用户快速发现业务模式;如何提升可视化组件的交互友好程度,例如高效地缩放和导航;大规模图环境下底层算法的效率。
  • 4
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值