- 博客(12)
- 资源 (9)
- 收藏
- 关注
转载 当BERT遇上知识图谱
写在前面上篇博客理了一下一些知识表示学习模型,那今天我们来看目前最流行的BERT模型加上外部知识这个buff后到底会有怎么样的发展。其实这个思路在之前就有出现过比较有意思且高效的工作,像百度的ERNIE和ERNIE2.0 以及清华的ERNIE,这些工作的介绍可以参考站在BERT肩膀上的NLP新秀们(PART I)。√ KG-BERT from NWU√ K-BERT from PKU...
2019-12-31 15:44:26 2874
转载 ######好好好好#####知识图谱推理与实践(1)
知识图谱推理与实践(1)由于工作原因,需要在系统里建立图谱推理功能,因此简单学习了浙江大学 陈华钧教授 知识图谱导论课程课件,这里记录下学习笔记。知识图谱推理的主要方法• 基于描述逻辑的推理(如DL-based)• 基于图结构和统计规则挖掘的推理(如: PRA、 AMIE)• 基于知识图谱表⽰学习的推理(如: TransE)• 基于概率逻辑的⽅法(如: Statistical R...
2019-12-22 15:49:25 587
转载 网页抽取技术和算法
基于机器学习的网页抽取基于正则或CSS选择器(或xpath)的网页抽取都基于属于基于包装器(wrapper)的网页抽取,这类抽取算法的通病就在于,对于不同结构的网页,要制定不同的抽取规则。如果一个舆情系统需要监控10000个异构网站,就需要编写并维护10000套抽取规则。从2000年左右就开始有人研究如何用机器学习的方法,让程序在不需要人工制定规则的情况下从网页中提取所需的信息。从目前的科研...
2019-12-22 10:52:15 690
转载 知识图谱入门 (六) 知识融合
知识融合简介知识融合,即合并两个知识图谱(本体),基本的问题都是研究怎样将来自多个来源的关于同一个实体或概念的描述信息融合起来。需要确认的是:等价实例等价类/子类等价属性/子属性一个例子如上图所示,图中不同颜色的圆圈代表不同的知识图谱来源,其中在dbpedia.org中的Rome 和geoname.org的roma是同一实体,通过两个sameAs链接。不同知识图谱间的实体对齐是KG...
2019-12-20 13:12:59 677
转载 知识图谱之知识融合
最近在“小象学院”上知识图谱的课程,做了一些笔记,现整理了一下1、什么是知识融合将来自不同知识库的同一实体融合在一起目标:融合各层面的知识合并两个知识图谱(本体),需要确认的是:(1)等价实例实体的匹配左右两个人是同一个人samsAs猫王(2)等价类/子类摇滚歌...
2019-12-20 13:10:27 958
转载 阿里开源大规模分布式图学习框架:专为Graph嵌入,无缝对接TF/PyTorch
阿里妈妈开源大规模分布式图表征学习框架Euler,面向工业级用户和高级研究者,结合TF/XDL/PyTorch等深度学习基础工具,支持超大规模复杂异构图的模型训练。阿里妈妈宣布开源大规模分布式的图表示学习框架Euler,Euler内置DeepWalk、Node2Vec等业界常见的Graph Embedding算法,以及3种阿里妈妈自研创新算法,可以支持数十亿点和数百亿边的复杂异构图上进行...
2019-12-19 17:51:40 467
转载 社区检测与高密子图挖掘(上)
前面我们说过图的第二个优点是拉帮结派,在图里面是很容易形成团伙结构,近年来,研究这个问题的论文也是汗牛充栋。本章,我们就这一问题所衍生出来的两个方面:社区检测(Community Detection)和高密子图挖掘(Dense Subgraph Mining)作相关讲解。本文,我们先讲社区检测的相关算法。社区检测的任务是什么呢?举个例子,给定如下图。直观印象告诉我们,该图存在以下的社区...
2019-12-11 14:59:57 785
转载 java后端技术
java后端技术技术概论:Springmvc+mybatis+shiro+Dubbo+ZooKeeper+Redis+KafKa j2ee分布式架构目前已经对接的互联网公司,金融公司,基金公司,银行等几十家企业,后端主要的技术:服务框架:Dubbo,zookeeper,Rest服务缓存:redis,ehcache消息中间件:ActiveMQ,kafka负责均衡:Nginx分...
2019-12-09 10:10:50 275
转载 银行核心系统|应用架构与案例,这次不谈中台
应用架构(Application Architecture)介于业务与数据和技术架构之间,在银行企业架构和信息系统规划起着很重要的作用。本文主要介绍应用架构的原则和包含的内容,以及典型银行应用架构的样子。此文适合人群:银行从业人员,企业架构师,系统架构师、软件工程师。此文解决问题:应用架构的概念、原则、工具、视图银行应用架构内容此文分为四部分...
2019-12-05 10:10:29 1241
转载 ####好好好好好#####GraphSAGE:我寻思GCN也没我牛逼
众所周知,2017年ICLR出产的GCN现在是多么地热门,仿佛自己就是图神经网络的名片。然而,在GCN的风头中,很多人忽略了GCN本身的巨大局限——Transductive Learning——没法快速表示新节点,这限制了它在生产环境中应用。同年NIPS来了一篇使用Inductive Learning的GraphSAGE,解决了这个问题。今天,让我们来一起琢磨琢磨这个GraphSAGE是...
2019-12-03 18:05:37 350
转载 ###haohaohao#####为什么要进行图嵌入(Graph embedding)?
为什么要进行图嵌入(Graph embedding)?本文参考这篇文章【9】的结构,对其中的部分内容进行修改和补充,其中文中图来大部分自该文章【9】Graph广泛存在于真实世界的多种场景中,即节点和边的集合。比如社交网络中人与人之间的联系,生物中蛋白质相互作用以及通信网络中的IP地址之间的通信等等。除此之外,我们最常见的一张图片、一个句子也可以抽象地看做是一个图模型的结构,图结构可以说是无...
2019-12-03 14:31:11 691
转载 数据集 | 图网络一般适用的数据集整理
本文从图网络的现有论文中梳理出了目前图网络被应用最多的数据集,主要有三大类,分别是引文网络、社交网络和生物化学图结构,分类参考了论文《A Comprehensive Survey on Graph Neural Networks》。(结尾附数据集下载链接)1.引文网络(Cora、PubMed、Citeseer)引文网络,顾名思义就是由论文和他们的关系构成的网络,这些关系包括例如引用关系、共...
2019-12-02 14:34:12 7649 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人