![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
知识图谱笔记
文章平均质量分 68
约定写代码
虽然8年前开始学习更好,但今天开始学习,总要好过明天再开始。
展开
-
基于知识图谱的问答系统实践
文章目录1 项目目标2 模型介绍3 代码4 总结与优化1 项目目标基于知识图谱的问答系统,简称为KBQA,是知识图谱的一种应用方式。在本项目中的知识图谱数据是关于公司的。数据中包含公司的主键、名称、分红方式、所处行业、债券类型等,也包含公司主要职位的人物名称,还有公司与公司之间的关系。经过分析之后,我们建立的图谱中的实体有:公司、人物、行业、分红方式、违规类型、债券类型。公司与公司之间的关系有:供应商、客户、公担保。人物与公司之间的关系有:监事、董事。公司与行业的关系:属于。公司与分红方式的关系:属于原创 2021-07-09 08:47:03 · 5654 阅读 · 1 评论 -
图谱问答-句子向量&模型部署&项目总结(未完)
内容来自七月算法nlp课程。文章目录1 句子向量1.1 bert句子向量表示相似度效果不好1.2 sentence-bert1 句子向量句子向量是用于实体消岐的。可以使用Elmo,也可以使用bert。这里介绍用bert生成句子向量。1.1 bert句子向量表示相似度效果不好Bert中最常用的句向量方式是采用cls标记位或者平均所有位置的输出值,注意,在采用平均的方式的时候,我们需要先做一个mask的操作,计算均值时,除以mask的和。但bert的句子向量效果不理想。为什么呢?原因1:词频率影响原创 2021-06-02 07:16:20 · 215 阅读 · 0 评论 -
图谱问答-理解query
内容来自七月算法nlp课程。图谱问题是用户输入一句话,系统返回这句话的答案。这里分多种情况。例如根据实体和关系查询尾实体,或者根据实体查询关系,甚至还会出现多跳的情况,不同的情况采用的方法略有不同。1 根据实体和关系查询尾实体需要两个步骤完成:第一步找到实体与关系;第二步实体链接和实体消岐。1.1 找到实体与关系NER的方式很多。可以采用传统机器学习的分类方法,也可以使用深度学习神经网络,一般架构为encoder+cfr层。这里重点介绍AC自动机1.1.1 AC自动机1、构建前缀树2、给前原创 2021-05-27 08:52:11 · 528 阅读 · 2 评论 -
知识图谱中三元组抽取
内容来自七月算法nlp课程。这是要解决知识图谱中的其中一个问题:从非结构文本中抽取三元组。要解决这个问题,总体思路有通过模板抽取、通过模型抽取。三元组工业界一般都存储在neo4j中,学术界会采用RDF形式存储。1结构化数据抽取定义好schema。按照schema的格式,把关系型数据转为图数据。2 非结构化数据抽取2.1 通过模板抽取通过模板抽取,这个一般是通过正则实现,课程上不做过多介绍。2.2 通过模型抽取模型的整体结构如图所示,输入是一段文本信息,经过encoder层进行编码,提取原创 2021-05-24 06:26:52 · 9919 阅读 · 6 评论 -
知识图谱需要解决的问题
1 知识图谱应用场景1、数据可视化2、基于图谱的问答系统3、基于图谱的关系推理4、便捷的关系查询,给模型提供更多数据特征2 知识图谱的构建非结构化数据源中的实体识别:一般来说是一个sequence labeling的任务。非结构化数据源中的关系抽取:通常都会提供好固定的一些关系,因此该任务就是一个分类问题。非结构化数据源中的三元组抽取3基于知识图谱的问答根据问题,解析三元组中的两个元素,查询第三个元素如何确定subject:entity linking->name dict原创 2021-04-24 22:25:36 · 1811 阅读 · 0 评论 -
词汇挖掘与实体识别(未完)
文章目录1 概述2 词汇挖掘2.1 关键词提取2.1.1 基于特征统计2.1.2 基于主题模型2.1.3 Text-Rank算法提取2.2 同义词挖掘2.2.1 同义词类型2.2.2 挖掘2.3 缩略词挖掘2.4 新词挖掘3 实体识别(NER)3.1 基于概率图模型3.2 基于深度学习1 概述实体:是文本中的一些词汇或者短语。例如清华大学、李白。但有些词汇不是实体。例如鲜艳的,守株待兔。具体措施:挖掘尽可能多高质量的词汇,筛选目标知识图谱中的实体。2 词汇挖掘2.1 关键词提取2.1.1 基于原创 2021-03-17 08:56:52 · 614 阅读 · 0 评论 -
知识图谱存储与搜索
本系列是学习七月算法知识图谱课程的笔记知识图谱存储是一个技术活。根据数据量以及关系复杂程度可能会选择不同的介质。课程里面直接用了neo4j。讲了neo4j安装、语法、建库、添加数据、导入数据、查询数据。最后讲了在应用中的一些高级查询。例如朋友圈检测、欺诈团检测。...原创 2021-03-17 08:21:14 · 173 阅读 · 0 评论 -
知识图谱基础
本系列是学习七月算法知识图谱课程的笔记。感觉自己完全就是一个托儿。前面七月算法机器学习,七月算法深度学习的笔记。现在又来了知识图谱课程的笔记。文章目录1 why知识图谱2 知识图谱前世今生3 知识图谱相关技术4 知识图谱应用案例1 why知识图谱没有知识图谱,计算机看到一个文字的时候只能是一个文字。例如看到“Magdalena Carmen Frida Kahlo y Calderón”,不能知道其中文名称、简称、相关作品。我们想要达到目标:things not strings如果做到呢?深度学习原创 2021-03-16 12:56:46 · 221 阅读 · 0 评论