【CS520】斯坦福知识图谱课程学习笔记三

本文介绍了用户如何与知识图谱互动,关注自然语言理解的挑战,如句子理解、语义关系挖掘和实体分类。同时,探讨了适应性自我解释架构在处理错误和持续学习中的作用。在工业界,重点讨论了属性图的应用,如使用Neo4j生态系统,并提及数据存储、管理及查询。此外,提到了NLP模型(如BERT)、词嵌入和图神经网络在关系推理中的应用。
摘要由CSDN通过智能技术生成

第六讲 How do users interact with knowledge graph?

Natural Language Understanding
句子理解的关键信号点:

  • 语句的信号词
  • 句法解析树
  • 上下文的语义

NLP challenges

  • 如何从少量的数据中快速学习
  • 如何从文本中挖掘语义关系
  • 如何将已知的实体进行更为可靠的分类
  • 将上下文语义更好的融入单词

自适应的自我解释架构
在机器学习算法中,没有固定一成不变的数据集,因此需要设计不断适应的可解释性框架

  • 受到人群之间沟通的启发,人们沟通的主题或解释性是可重叠的(本地处理)
  • 在交流和交互沟通中,持续不断的进行解释(本地处理)
  • 错误发生时,会自动存储错误,并且结合人的解释不断更新(重复交互)

在这里插入图片描述

第七讲 What are some prelevant graph engines in industry?

How to best use this talk?

  • 学习属性图property graphs
  • 第一次动用图形算法graph algorithms
  • 强调有关图谱的实际应用:广度优先搜索&软件开源&实体链指等

property graph
motivated by

  • data storage & management
  • querying
  • developers & applications

Neo4j 生态系统
在这里插入图片描述
Technologies Used

  • 数据准备和知识图谱构建所需的SQL语句和Spark框架
  • 利用NLP模型(BERT)从文本中获得语义关联
  • 传统的词嵌入算法、图神经网络用于关系推理的应用
  • 对于生物知识图谱还有一些自定义的数据类型等

Summary

  • 随着机器生成的数据逐渐增多,知识图谱的规模也会持续不断的扩大。因此更加需要致力于存储和语义关联查询这部分数据,而不是抛开它
  • 对于知识图谱研究,将特定的分析工具和知识图谱的通用方法结合,是更有效的方法
  • 算法模型需要是线性的或者次线性的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值