第六讲 How do users interact with knowledge graph?
Natural Language Understanding
句子理解的关键信号点:
- 语句的信号词
- 句法解析树
- 上下文的语义
NLP challenges
- 如何从少量的数据中快速学习
- 如何从文本中挖掘语义关系
- 如何将已知的实体进行更为可靠的分类
- 将上下文语义更好的融入单词
自适应的自我解释架构
在机器学习算法中,没有固定一成不变的数据集,因此需要设计不断适应的可解释性框架
- 受到人群之间沟通的启发,人们沟通的主题或解释性是可重叠的(本地处理)
- 在交流和交互沟通中,持续不断的进行解释(本地处理)
- 错误发生时,会自动存储错误,并且结合人的解释不断更新(重复交互)
第七讲 What are some prelevant graph engines in industry?
How to best use this talk?
- 学习属性图property graphs
- 第一次动用图形算法graph algorithms
- 强调有关图谱的实际应用:广度优先搜索&软件开源&实体链指等
property graph
motivated by
- data storage & management
- querying
- developers & applications
Neo4j 生态系统
Technologies Used
- 数据准备和知识图谱构建所需的SQL语句和Spark框架
- 利用NLP模型(BERT)从文本中获得语义关联
- 传统的词嵌入算法、图神经网络用于关系推理的应用
- 对于生物知识图谱还有一些自定义的数据类型等
Summary
- 随着机器生成的数据逐渐增多,知识图谱的规模也会持续不断的扩大。因此更加需要致力于存储和语义关联查询这部分数据,而不是抛开它
- 对于知识图谱研究,将特定的分析工具和知识图谱的通用方法结合,是更有效的方法
- 算法模型需要是线性的或者次线性的