知识图谱相关介绍

最新推荐文章于 2024-05-05 10:34:52 发布

胖大星越来越胖

最新推荐文章于 2024-05-05 10:34:52 发布

阅读量3.1k

点赞数 1

文章标签：知识图谱互联网 nlp KG

本文链接：https://blog.csdn.net/iloveayu/article/details/76714077

版权

知识图谱分享概念介绍什么是知识，知识从哪来现实世界的语义本体，本体的相关语义，本体的认知层次，本体间的关系，都可以叫做知识知识从哪里来结构化文本 wiki，infobox，tables，database，social-net 非结构化文本互联网，新闻，社交媒体…图像，视频流什么是知识图谱实体-对应现实世界的语义本体关系-对应本体间的关系，连接了不

摘要由CSDN通过智能技术生成

知识图谱概要

概念介绍

什么是知识，知识从哪来

现实世界的语义本体，本体的相关语义，本体的认知层次，本体间的关系，都可以叫做知识

知识从哪里来

结构化文本
wiki，infobox，tables，database，social-net
非结构化文本
互联网，新闻，社交媒体…
图像，视频流

什么是知识图谱

实体-对应现实世界的语义本体
关系-对应本体间的关系，连接了不同类型的实体
属性-描述一类实体的common特性，实体被属性所标注

为什么需要知识图谱

查询理解
- 优化搜索排序
  - 对同名实体进行搜索属性，为什么百度和google给出了不一样的排序结果？
- 特定意图的知识展现
  - 搜索李娜和奥运会，出现了李娜的奥运会名次，还有侧边栏的体育人物展现逻辑
智能问答（KB-QA)
- 知识推理
  - 谓词逻辑和消解原理
    
    一系列推理以后，发现关于李明的假设没有推理出合理命题，最后得假设为假
    ![这里写图片描述])
金融领域
- 反欺诈
- - 智能投顾
社交领域
- 兴趣推荐
- 用户聚类
  - SimRank
    - $S (U 1, U 2) = C | I ( U 1 ) | | I ( U 2 ) | \sum i = 1 | I (U 1) | \sum j = 1 | I (U 2) | S (I i (U 1), I j (U 2))$ $S(U_1,U_2) = \frac{C}{|I(U_1)||I(U_2)|}{\displaystyle\sum\limits_{i=1}^{|I(U_1)|}\sum\limits_{j=1}^{|I(U_2)|}S(I_i(U_1),I_j(U_2))}$

怎么存储知识图谱

rdf （语义网）

     <?xml version="1.0"?>     
        <RDF>  
        <Description about="http://www.yahoo.com/">  
        <资源作者>Yahoo！公司</资源作者>  
        <资源名称>Yahoo！首页</资源名称>  
        </Description>  
        </RDF>

图数据库

neo4j

    插入  
    CREATE (n:Person { name : 'Andres'});
    删除  
    MATCH (n:Person { name:'Andres' }) 
    DETACH DELETE n; 
    查询  
    MATCH (a:Person { name:'Andres' })-[r]->(b:Person { name:'Taylor' }) 
    RETURN type(r); 
    CREATE CONSTRAINT ON (a:Person) ASSERT a.name IS UNIQUE; 
    MATCH (a:Person),(b:Person) 
    WHERE a.name = 'Node A' AND b.name = 'Node B' 
    CREATE (a)-[r:Follow]->(b); 
    MATCH (a:Person)-[r:Follow]->(b:Person) 
    WHERE a.name = 'Andres' AND b.name = 'Taylor' 
    DELETE r; 
    MATCH (:Person { name:'Taylor' })-[r:Follow]->(Person) 
    RETURN Person.name; 
    创建索引  
    CREATE INDEX ON :Person(name);

titan

Transform
g = TinkerGraphFactory.createTinkerGraph()
g.V().in().outE().toList()
g.V().in().outE().toList()g.v(1).map
g.E.has(‘weight’, T.gt, 0.5f).outV.age.(_).transform{it+2}

Filter
e.outV.outE(e.label).filter{ElementHelper.haveEqualProperties(e,it)}.as('e').inV.filter{it==e.inV.next()}.back('e').except([e])
g.V[0..2].name
g.v(1).outE.and(_().has('weight', T.gt, 0.4f), _().has('weight', T.lt, 0.8f))
g.V.as(‘x’).outE(‘knows’).inV.has(‘age’, T.gt, 30).back(‘x’).age


sideEffect
g.v(1).out.aggregate(x).next()
g.V.groupBy{it}{it.out}.cap

Method
g.addVertex(100)
g.addVertex(null,[name:"stephen"])

知识图谱的关键问题

信息抽取(Infomation Extraction)

什么是信息抽取
从自然语言文本中抽取指定类型的实体、关系、事件等事实信息，并形成结构化数据输出的文本处理技术
自然语言处理和信息抽取

实体链接(Entity Linking )

问题分类

实体识别
人名，地名，机构名，时间，日期，货币，百分比
子任务:实体边界识别和确定实体类别
开放域实体抽取
实体消歧
如何确定一个实体指称所指向的是真实世界的实体？
- bow方法计算相似度
  $s c o r e (q, e k) = c o s (q . T, e k . T) = q . T , e k . T | | q . T | | | | e k . T | |$ $score(q,e_k) = cos(q.T,e_k.T) = \frac{q.T,e_k.T}{||q.T||||e_k.T||}$
  $e ̂ = a r g m a x s c o r e (q, e k)$ $\hat{e} = argmax{score(q,e_k)}$
- 加入其特征的分类
  1. 类别共现特征
  2. 文本相似度
  3. 实体本身流行度 $P(e)$
  4. 实体到指代的先验 $P(s|e)$
  5. 实体上下文的先验 $P(c|e)$
- 实体在网页链接上的社会化关系进行聚类消歧
- 基于实体链接的方法
  1. Pairwise
  2. Referent Graph

方法分类

manual-Defining Domain
- 高精度的语义本体
- 高准确的提取算子
- 构建成本高
- 需要业务专家
Sime-automatic
- 本体类型上下位人工定义
- - SSL实现data上的label
  - 用已有类别很容易判断实体类型
  - 可以从现有的语料库中抽取出关系
  - 可以得到较为松散提取语法
Automatic
- 所有名词短语都是实体
- 所有动词短语都是属性
- 频率统计实现挖掘

web实体抽取系统构成

Fetcher
把种子放到相关搜索引擎，把topN的相关页面爬取下来
Extractor
针对单个页面，使用模板抽取候选实例
Ranker
构建种子，网页，模板，候选的相关排序规则，计算候选的置信度

实体链接的评测方法

以指代项准的评测
$A c c u a r c y m i c r o = N u m C o r r e c t N u m Q u e r i e s$ $Accuarcy_{micro} = \frac{NumCorrect}{NumQueries}$
以实体为标准的评测
$A c c u a r c y m i c r o = \sum i N u m E n t i t y s N u m C o r r e c t ( E i ) N u m Q u e r i e s ( E i ) N u m Q u e r i e s$ $Accuarcy_{micro} = \frac{\sum\limits_{i}^{NumEntitys}\frac{NumCorrect(Ei)}{NumQueries(Ei)}}{NumQueries}$

关系挖掘(Relation Extraction)

目标-自动识别由一对概念和联系这对概念的关系构成的相关三元组

最低0.47元/天解锁文章

胖大星越来越胖

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
知识图谱相关介绍

知识图谱分享概念介绍什么是知识，知识从哪来现实世界的语义本体，本体的相关语义，本体的认知层次，本体间的关系，都可以叫做知识知识从哪里来结构化文本 wiki，infobox，tables，database，social-net 非结构化文本互联网，新闻，社交媒体…图像，视频流什么是知识图谱实体-对应现实世界的语义本体关系-对应本体间的关系，连接了不
复制链接

扫一扫