【收藏】超全整理知识图谱相关学习资料,提供系统化的知识图谱学习路径

点击上方,选择星标置顶,每天给你送干货

阅读大概需要25分钟

跟随小博主,每天进步一丢丢

作者:husthuke

编辑:zenRRan 稍有改动

https://github.com/husthuke/awesome-knowledge-graph

导读


目录

  • 理论及论文

  • 图谱及数据集

  • 工具及服务

  • 白皮书及报告

  • 机构及人物

  • 视频课程

  • 专栏合集

  • 评测竞赛

  • 项目案例

  • 推广技术文章

理论及论文


综述-Survey

知识图谱构建技术综述

https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E6%8A%80%E6%9C%AF%E7%BB%BC%E8%BF%B0_%E5%88%98%E5%B3%A4.caj

知识图谱技术综述

https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%8A%80%E6%9C%AF%E7%BB%BC%E8%BF%B0.pdf

知识图谱研究综述

https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%A0%94%E7%A9%B6%E7%BB%BC%E8%BF%B0-%E6%9D%8E%E6%B6%93%E5%AD%90.pdf

知识图谱研究进展

https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%A0%94%E7%A9%B6%E8%BF%9B%E5%B1%95_%E6%BC%86%E6%A1%82%E6%9E%97.caj

医学知识图谱构建技术与研究进展

https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E5%8C%BB%E5%AD%A6%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E6%8A%80%E6%9C%AF%E4%B8%8E%E7%A0%94%E7%A9%B6%E8%BF%9B%E5%B1%95_%E8%A2%81%E5%87%AF%E7%90%A6.caj

命名实体识别-NER


推理-Reasoning

ATOMIC: An Atlas of Machine Commonsense for If-Then Reasoning

知识库问答-KBQA


动态或时序知识图谱

Learning Sequence Encoders for Temporal Knowledge Graph Completion

图谱及数据集


开放知识图谱

中文开放知识图谱(OpenKG.CN)

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用,包括了众多的数据集以及工具。

官网地址:http://openkg.cn/

领域知识图谱

学术知识图谱AceKG

最新发布的Acemap知识图谱(AceKG)描述了超过1亿个学术实体、22亿条三元组信息,涵盖了全面的学术信息。具体而言,AceKG包含了61,704,089篇paper、52,498,428位学者、50,233个研究领域、19,843个学术研究机构、22,744个学术期刊、1,278个学术会议以及3个学术联盟(如C9联盟)。

同时,AceKG也为每个实体提供了丰富的属性信息,在网络拓扑结构的基础上加上语义信息,旨在为众多学术大数据挖掘项目提供全面支持。

访问地址:http://acemap.sjtu.edu.cn/

数据集


SQuAD

https://rajpurkar.github.io/SQuAD-explorer/

YAGO

YAGO是由德国马普研究所研制的链接数据库。YAGO主要集成了Wikipedia、WordNet和GeoNames三个来源的数据。YAGO将WordNet的词汇定义与Wikipedia的分类体系进行了融合集成,使得YAGO具有更加丰富的实体分类体系。YAGO还考虑了时间和空间知识,为很多知识条目增加了时间和空间维度的属性描述。目前,YAGO包含1.2亿条三元组知识。YAGO是IBM Watson的后端知识库之一。由于完成的YAGO数据集过于庞大,在使用过程中经常会选取其中一部分进行,比如可以抽取中带有时间注释(time annotations)的部分形成YAGO11k数据集。

完整数据集下载地址:

https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/

WikiData

WikiData的目标是构建一个免费开放、多语言、任何人或机器都可以编辑修改的大规模链接知识库。WikiData由维基百科于2012年启动,早期得到微软联合创始人Paul Allen、Gordon Betty Moore基金会以及Google的联合资助。WikiData继承了Wikipedia的众包协作的机制,但与Wikipedia不同,WikiData支持的是以三元组为基础的知识条目(Items)的自由编辑。一个三元组代表一个关于该条目的陈述(Statements)。

WikiData中文部分-截至2017.01:

http://openkg.cn/dataset/http-pan-baidu-com-s-1c2ovnks

NLPCC 2017 KBQA

该任务来自NLPCC 2017评测任务,开放域问答评价任务主要包括三项子任务,基于知识库的问答(kbqa),基于文档的问答(dbqa),和基于表的问答(tbqa)。kbqa的任务是基于知识库的中文问题回答。dbqa的任务是通过选择一个或多个句子从一个给定的文档,作为答案回答中文问题。tbqa的任务是一个全新的QA任务,旨在通过从收集的表格中抽取一个或多个表回答英语问题。

下载链接:

https://biendata.com/ccf_tcci2018/datasets/tcci_tag/11

GDELT

GDELT(Global Database of Events, Language, and Tone)是最大的综合人类社会关系数据库,以100多种语言监控来自每个国家几乎每个角落的广播、印刷和网络新闻,并确定推动我们全球社会的人、地点、组织、主题、来源、情感、计数、报价、图像和事件每天的每一秒,它的全球知识图将世界的人,组织,地点,主题,计数,图像和情感连接到整个地球上的单一整体网络。为整个世界的计算创建一个免费的开放平台。

下载链接:https://www.gdeltproject.org/

ICEWS

ICEWS(Integrated Crisis Early Warning System)捕获和处理来自数字化新闻媒体,社交媒体和其他来源的数百万条数据,以预测,跟踪和响应世界各地的事件,主要用于早期预警。该数据集在知识图谱领域主要用于动态事件预测等动态图谱方面。

下载链接:https://dataverse.harvard.edu/dataverse/icews

OAG

OAG(Open Academic Graph包含来自MAG的166,192,182篇论文和来自AMiner的154,771,162篇论文,并生成了两个图之间的64,639,608个链接(匹配)关系。它可以作为研究引文网络,论文内容等的统一大型学术图表,也可以用于研究多个学术图表的整合。

下载链接:https://www.aminer.cn/open-academic-graph

工具

根据知识图谱的通用基本构建流程为依据,每个阶段都整理部分工具。

知识建模

知识抽取

Deepdive

知识推理

  • 官网地址:

    http://deepdive.stanford.edu/

  • Github地址:

    https://github.com/HazyResearch/deepdive

知识表示

OpenKE

清华大学NLP实验室基于TensorFlow开发的知识嵌入平台,实现了大部分知识表示学习方法。

  • 官网地址:

    http://openke.thunlp.org/

  • Github地址:

    https://github.com/thunlp/OpenKE

知识融合

白皮书及报告

CCKS2018-知识图谱发展报告

https://github.com/husthuke/awesome-knowledge-graph/blob/master/report/CCKS2018-%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E5%8F%91%E5%B1%95%E6%8A%A5%E5%91%8A.pdf

机构及人物

本部分介绍在知识图谱领域前沿研究或者有一定影响力的机构以及个人。

机构人物

李娟子:清华大学网页 

http://keg.cs.tsinghua.edu.cn/persons/ljz/

刘知远:清华大学网页

http://nlp.csai.tsinghua.edu.cn/~lzy/

          知乎主页

https://www.zhihu.com/people/zibuyu9/activities

漆桂林:东南大学网页

https://cse.seu.edu.cn/2019/0103/c23024a257135/page.htm

肖仰华:复旦大学网页

http://gdm.fudan.edu.cn/GDMWiki/Wiki.jsp?page=Yanghuaxiao

刘康:中科院网页

http://people.ucas.ac.cn/~liukang

刘挺:哈工大网页

http://homepage.hit.edu.cn/liuting

王昊奋

视频课程

小象学院知识图谱课程

知识图谱

https://www.chinahadoop.cn/course/1048

贪心学院知识图谱课程

知识图谱的技术与应用

https://www.greedyai.com/course/19/summary/introduce

教你搭建一个工业级知识图谱系统

https://www.greedyai.com/course/30/summary/knowledgeMapProject

炼数成金知识图谱课程

CSDN视频课

知识图谱系统架构剖析

https://edu.csdn.net/course/detail/10286

AI开发者大会——知识图谱专题

https://edu.csdn.net/course/detail/10284

专栏合集

知乎集合

简书集合

评测竞赛

瑞金医院MMC人工智能辅助构建知识图谱大赛

https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.0.0.457933afBacvqN&raceId=231687

CCKS 2018 面向中文电子病历的命名实体识别

https://www.biendata.com/competition/CCKS2018_1/

CCKS 2018 面向音乐领域的命令理解任务

https://www.biendata.com/competition/CCKS2018_2/

CCKS 2018 微众银行智能客服问句匹配大赛

https://www.biendata.com/competition/CCKS2018_3/

CCKS 2018 开放领域的中文问答任务

https://www.biendata.com/competition/CCKS2018_4/

CCKS 2017 问题命名实体识别和链接任务

https://www.biendata.com/competition/CCKS2017_1/

CCKS 2017 面向电子病历的命名实体识别

https://www.biendata.com/competition/CCKS2017_2/

会议交流及讲座

AICon

AICon 2017知识图谱技术实践

https://aicon2017.geekbang.org/training/1

AICon 2018知识图谱深度培训

https://aicon2018.geekbang.org/training/1315

BDTC

BDTC 2018 医疗知识图谱的构建和应用

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%8C%BB%E7%96%97%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%9A%84%E6%9E%84%E5%BB%BA%E5%92%8C%E5%BA%94%E7%94%A8.pdf

BDTC 2018 从知识图谱到人工智能:产品演进路径上的思考

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E4%BB%8E%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E5%88%B0%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD-%E4%BA%A7%E5%93%81%E6%BC%94%E8%BF%9B%E8%B7%AF%E5%BE%84%E4%B8%8A%E7%9A%84%E6%80%9D%E8%80%83.pdf

BDTC 2018 基于cnSchema的大规模金融知识图谱实战

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%9F%BA%E4%BA%8EcnSchema%E7%9A%84%E5%A4%A7%E8%A7%84%E6%A8%A1%E9%87%91%E8%9E%8D%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E5%AE%9E%E6%88%98.pdf

[BDTC 2017 Event Extraction from Texts](./conference/Event Extraction from Texts.pdf)

BDTC 2017 知性会话:基于知识图谱的人机对话系统方法与实践

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E7%9F%A5%E6%80%A7%E4%BC%9A%E8%AF%9D-%E5%9F%BA%E4%BA%8E%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%9A%84%E4%BA%BA%E6%9C%BA%E5%AF%B9%E8%AF%9D%E7%B3%BB%E7%BB%9F%E6%96%B9%E6%B3%95%E4%B8%8E%E5%AE%9E%E8%B7%B5.pdf

BDTC 2017 基于图的海量知识图谱数据管理

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%9F%BA%E4%BA%8E%E5%9B%BE%E7%9A%84%E6%B5%B7%E9%87%8F%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%95%B0%E6%8D%AE%E7%AE%A1%E7%90%86.pdf

CSDN AI 2018 医疗知识图谱的敏捷构建和实践

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%8C%BB%E7%96%97%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%9A%84%E6%95%8F%E6%8D%B7%E6%9E%84%E5%BB%BA%E5%92%8C%E5%AE%9E%E8%B7%B5.pdf

CSDN AI 2018 知识图谱的表示和推理

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%9A%84%E8%A1%A8%E7%A4%BA%E5%92%8C%E6%8E%A8%E7%90%86.pdf

CSDN AI 2018 大规模通用知识图谱构建及应用

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%A4%A7%E8%A7%84%E6%A8%A1%E9%80%9A%E7%94%A8%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E5%8F%8A%E5%BA%94%E7%94%A8.pdf

CSDN AI 2018 大规模通用知识图谱构建及应用

https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%A4%A7%E8%A7%84%E6%A8%A1%E9%80%9A%E7%94%A8%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E5%8F%8A%E5%BA%94%E7%94%A8.pdf

其他

知识图谱中的深度学习技术应用概述

https://v.qq.com/x/page/i0700c29hw1.html

2018云栖大会上海-人工智能专场

https://yunqi.youku.com/2018/shanghai/review?spm=a2c4e.11165380.1076033.1

AI研习社-知识图谱的嵌入:更好更快的负采样

http://www.mooc.ai/open/course/640

项目案例

教育领域知识图谱


金融领域知识图谱

利用网络上公开的数据构建一个小型的证券知识图谱/知识库

https://github.com/lemonhu/stock-knowledge-graph.git

医疗领域知识图谱

农业领域知识图谱

使用爬虫获取Wikidata数据构建

https://github.com/CrisJk/Agriculture-KnowledgeGraph-Data.git

佛学知识图谱

知识工程领域知识图谱

推广技术文章

2016

构建 LinkedIn 知识图谱

https://www.infoq.cn/article/constructing-linkedin-knowledge-map

2017

阿里知识图谱首次曝光:每天千万级拦截量,亿级别全量智能审核

百度王海峰:知识图谱是 AI 的基石

https://www.infoq.cn/article/2017/11/Knowledge-map-cornerstone-AI

哈工大刘挺:从知识图谱到事理图谱

智能导购?你只看到了阿里知识图谱冰山一角

https://www.csdn.net/article/a/2017-12-08/15937080

2018

张伟博士:阿里巴巴百亿级别的三元组知识图谱掌舵者

https://www.shangyexinzhi.com/article/details/id-28524/

知识图谱在互联网金融行业的应用

上交大发布知识图谱AceKG,超1亿实体,近100G数据量

知识图谱数据构建的“硬骨头”,阿里工程师如何拿下?

https://yq.aliyun.com/articles/544941

这是一份通俗易懂的知识图谱技术与应用指南

https://www.jiqizhixin.com/articles/2018-06-20-4

一文揭秘!自底向上构建知识图谱全过程

https://102.alibaba.com/detail?id=134

健康知识图谱,阿里工程师如何实现?

https://102.alibaba.com/detail?id=176

为电商而生的知识图谱,如何感应用户需求?

https://yq.aliyun.com/articles/632483

肖仰华谈知识图谱:知识将比数据更重要,得知识者得天下

https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/83451280

知识图谱在旅游领域有哪些应用?携程度假团队这样回答

快手结合知识图谱进行多模态内容理解

https://www.infoq.cn/article/2018/09/Multimedia-Understanding-AI

腾讯互娱刘伟:知识图谱让AI更有学识

美团大脑:知识图谱的建模方法及其应用

https://tech.meituan.com/2018/11/01/meituan-ai-nlp.html

美团餐饮娱乐知识图谱——美团大脑揭秘

https://tech.meituan.com/2018/11/22/meituan-brain-nlp-01.html

人力资源知识图谱搭建及应用

https://www.jiqizhixin.com/articles/2018-11-23-3

2019

大众点评搜索基于知识图谱的深度学习排序实践

https://www.infoq.cn/article/JZ_qdBDiMc1pHpBMDR2Q

知识图谱已成AI下一风口,但你知道它进展到哪了吗?

https://36kr.com/p/5170293

下一代 AI 系统基石:知识图谱将何去何从?

https://www.infoq.cn/article/DCf3GUp_alTIMuyxYWl3

阿里巴巴电商认知图谱揭秘

https://www.secrss.com/articles/9743

阿里小蜜:知识结构化推动智能客服升级

https://www.infoq.cn/article/ocHiWF5rKuaBDxM5S28x


方便交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐阅读:

【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文

【一分钟论文】IJCAI2019 | Self-attentive Biaffine Dependency  Parsing

【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译

【一分钟论文】Semi-supervised Sequence Learning半监督序列学习

【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing

详解Transition-based Dependency parser基于转移的依存句法解析器

经验 | 初入NLP领域的一些小建议

学术 | 如何写一篇合格的NLP论文

干货 | 那些高产的学者都是怎样工作的?

一个简单有效的联合模型

近年来NLP在法律领域的相关研究工作


让更多的人知道你“在看”

  • 1
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值