知识工场 | 知识图谱暑假班开始报名啦!



知识图谱作为大数据时代重要的知识表示方式之一,已经成为人工智能领域的一个重要支撑。8月25日-27日,“复旦大学知识工场实验室”与“上海财经大学信息管理与工程学院”联合举办“知识图谱前沿技术暑假班”对《知识图谱-概念与技术》展开系统性介绍。

 

本次课程体系由复旦大学肖仰华教授策划,讲者来自复旦大学、南加州大学、湖南大学、香港中文大学、华东师范大学、微软亚洲研究院、上海财经大学、东华大学、苏州大学等青年学者。本次课程由上海财经大学承办,由上海财经大学崔万云博士负责课程的本地组织工作。

 

本次课程为期三天,累计27个课时。本次课程为非盈利活动,为覆盖运营成本,本次课程收取少量费用,并全部用于知识图谱课程建设和运营开支。因场地容量有限,限260人。学员需要报名注册,先注册和缴费者先得。



 

课程时间

8月25日 - 8月27日

具体课程时间段参照日程安排表


课程地点

上海财经大学武川路校区创业中心一楼报告厅

   

报名方式

在线报名,点击“阅读原文”进行报名登记,由于场地有限,本次课程限额260名,先报先得,以注册缴费先后为准。


费用及缴费方式

费用:学生 300 元 / 人

         非学生 1000 元 / 人

注:此费用仅为报名费用,参加课程人员的旅途费和食宿均为自理费用。

   

缴费方式

一:银行转账(仅限8月9日至8月20日之间

户   名:上海财经大学

账   号:454673639249

开户行:中国银行上海市五角场支行

说明:

① 转账备注“知识图谱课程+姓名+手机号”

② 保存包含备注信息的支付凭证(转账回执单或电子回单等能证明支付的凭证),签到时作为入场凭证

      

二:签到现场缴费,仅限POS刷卡。(仅限在线报名时间为8月21日至8月25日的参加课程人员,于8月25日上午 7:30 开始在财大现场缴费



缴费时间以在线报名登记时间为参考,即若报名登记时间为8月9日至8月20日之间,请银行转账;若报名时间为8月21日至8月25日之间,请现场缴费。

建议大家以银行转账的方式缴费,可以确保有座位。现场缴费仅限POS刷卡,不支持其他缴费方式,程序较慢且不确保有多余空位


注:学生到场签到需出示学生证等相关证件。


日程安排


640

   

讲者介绍



640

肖仰华 复旦大学


肖仰华博士,复旦大学教授、博士生导师、复旦大学知识工场实验室创始人、上海市互联网大数据工程技术中心副主任、多家规模企业高级顾问与首席科学家、知识图谱前沿技术系列课程发起人、十多个国家/省市/企业研究奖项获得者、三十多个国家/省市/企业研发项目负责人。在国际顶级学术会议与期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、TKDE等)发表论文百余篇,授权近20项知识图谱专利。百余次担任国际/国内学术机构/会议的学术服务工作。领导构建了知识库云服务平台(知识工场平台kw.fudan.edu.cn),发布了一系列知识图谱,以API形式为数百家应用单位服务近10亿次。



640

任翔 南加州大学


XiangRen is an Assistant Professor in the Department of Computer Science at USCaffiliated with USC ISI. At USC, he is part of the Machine Learning Center,NLP@USC, and Center on Knowledge Graphs. Priorly, Xiang was a visitingresearcher at Stanford University collaborating with Dan Jurafsky and JureLeskovec, and received his PhD in CS@UIUC. He is interested in computationalmethods and systems that extract machine-actionable knowledge from massiveunstructured text data, and is particularly excited about problems in the spaceof modeling sequence and graph data under weak supervision (learning withpartial/noisy labels, and semi-supervised learning) and indirect supervision(multi-task learning, transfer learning, and reinforcement learning). Hisresults were covered in several top conference tutorials and keynote (KDD, WWW,ACL) and he has served as area chairs and program committee members for topconferences including KDD, WWW, ACL and EMNLP. Xiang's research has beenrecognized with several prestigious awards including a Google PhD Fellowship,Yahoo!-DAIS Research Excellence Award, Yelp Dataset Challenge Award, WWW BestPoster Runner-up, and David J. Kuck Outstanding M.S. Thesis Award. Technologieshe developed has been transferred to US Army Research Lab, National Instituteof Health, Microsoft, Yelp and TripAdvisor.



640

徐波 东华大学


徐波博士,东华大学计算机科学与技术学院讲师。毕业于复旦大学计算机科学技术学院,获计算机软件与理论专业的博士学位。研究兴趣为知识图谱的构建及应用。创建了目前最大的中文开放知识图谱之一:CN-DBpedia。其研究成果论文先后在IJCAI、PKDD、DASFAA等国际顶级人工智能、数据库会议上发表。曾获中国数据库学术会议优秀论文奖。

 


640

林欣 华东师范大学


林欣博士,华东师范大学计算机系教授。目前主要致力于异构大数据管理研究和知识图谱研究。先后在该领域发表论文30余篇,其中近三年在中国计算机学会推荐的A类顶级期刊TKDE和A类会议ICDE发表论文8篇。2011年入选首批“香江学者计划”,赴香港浸会大学从事为期2年的访问研究。2014年回国后入选上海市“浦江人才计划”。现担任SCI杂志《Frontier of Computer Science》青年副主编,担任TKDE、TPDS等权威学术期刊的审稿人,并多次担任WAIM,ICPADS等国际会议的PC member。

 


640

李直旭 苏州大学


李直旭博士,苏州大学特聘副教授,硕士生导师。苏州大学先进数据分析研究中心副主任。2015年获江苏省“双创”博士称号,2013年毕业于澳大利亚昆士兰大学,获计算机科学博士学位。主要研究方向为:知识图谱,信息抽取,人机问答,数据质量和众包技术。李直旭现为CCF数据库专委会委员,人工智能学会智能服务专委会委员。承担国家自然科学基金及江苏省自然科学基金重大项目等国家和省部级项目5项。已在数据管理相关领域的顶级期刊和会议如TKDE, ICDE, EDBT, CIKM等上发表论文60余篇。长期担任国际期刊IEEE TKDE, WWWJ审稿人,并担任过多个数据管理领域国际会议的程序委员会委员。

 


640

邵斌 微软亚洲研究院


邵斌博士,微软亚洲研究院机器学习组主管研究员。他的研究兴趣包括机器学习、并行图处理、分布式系统和内存数据库等。邵斌博士于 2010 年加入了微软亚洲研究院,具体负责微软分布式大规模图数据处理引擎项目(Microsoft Graph Engine)。相关研究结果发表在SIGMOD, VLDB, ICDE, TPDS等相关领域顶级会议和期刊上。

 


640

彭鹏 湖南大学


彭鹏博士,2009 年毕业于北京师范大学信息科学与技术学院获得工学学士学位;2016 年毕业于北京大学计算机科学技术研究所,获得工学博士学位。2016 年入职湖南大学信息科学与工程学院软件工程系,任助理教授。目前其主要研究方向为“基于图的分布式RDF 知识库数据管理”。彭鹏近年来发表论文 12 篇,其中既包括 VLDB Journal、TKDE 等国际顶级期刊论文,也包括 EDBT、WWW Journal、Information Systems 等国际重要会议/期刊论文。主持国家级项目 1 项,为国家自然科学基金青年基金项目——“关联数据上基于图的分布式查询处理技术研究”。这些论文的工作涵盖了 RDF 数据管理,分布式查询处理以及图数据管理等领域。目前我们已经开发了多种分布式 RDF 数据管理算法、图数据库上的子图匹配查询算法以及 RDF 数据中关键词查询算法。

 


640

郑卫国 香港中文大学


郑卫国博士,毕业于北京大学,香港中文大学博士后,他的主要研究兴趣为图数据的管理和查询,特别是在知识图谱上的查询和挖掘,在国际顶级会议和期刊上发表多篇论文,包括SIGMOD、VLDB、ICDE、TODS、TKDE、CIKM等。

 


640

阳德青 复旦大学


阳德青博士,复旦大学大数据学院和大数据研究院副院长、副教授,于2013年在复旦大学计算机科学技术学院获得计算机软件与理论专业的博士学位。阳博士的主要研究领域为数据挖掘、知识图谱的构建与应用、推荐系统、社会网络分析等,其研究成果论文先后在WWW、ICDM、CIKM、ECML等数据科学领域的国际顶尖学术会议上发表,并拥有多项发明专利。同时,他先后主持、参加了多项国家科技部、自科基金委、上海市科委、经信委、教委等专项课题,并在与阿里、华为等科技公司的合作中取得了丰硕的实际应用成果。

 


640

 崔万云 上海财经大学


崔万云博士,上海财经大学信息管理与工程学院助理教授,智能金融课题组负责人,小Cui问答(微信公众号)和KBQA项目负责人。他仅以4年时间就获得了复旦大学5年制博士学位,同时获得了复旦大学最高博士荣誉“复旦学术之星”(计算机方向唯一)。其博士论文《基于知识图谱的问答系统关键技术研究》被授予了“2017ACM中国优秀博士生论文提名奖”,和“2017ACM上海优秀博士生论文奖”(top 2 in 上海)。和他的研究兴趣包括自然语言问答和知识图谱。自2012年起,他分别在微软亚洲研究院、百度深度问答小组和小i机器人等公司从事问答系统、知识图谱相关研究。他已经在PVLDB 2017,IJCAI 2016,AAAI 2016,SIGMOD 2014,SIGMOD 2013等顶级人工智能、数据库会议上发表第一作者论文。他还曾获得复旦大学毕业生之星、上海市优秀毕业生等奖项。

 



课程大纲目录


第一部分  知识图谱概述


1.1  知识图谱基本概念

1.2  知识图谱的历史沿革

1.3  知识图谱的特点

1.4  知识分类

1.5  典型知识图谱


第二部分  知识图谱构建


1     词汇挖掘与实体挖掘

1.1  词汇挖掘

1.2  同义词、缩写词挖掘

1.3  实体识别

1.4  实体分类


2     关系抽取

2.1  关系挖掘概述

2.2  基于Pattern的挖掘

2.3  基于传统机器学习模型的关系抽取

2.4  基于深度学习的关系抽取

2.5  远程监督与关系获取


3     概念知识图谱构建

3.1   概念图谱概述        

3.1.1 常见的概念图谱        

3.1.2 概念图谱的应用        

3.2 isA关系抽取

3.2.1 YAGO:从Wikipedia中构建概念图谱     

3.2.2 Probase:在英文语料上进行isA关系抽取    

3.2.3 CN-Probase:中文isA关系抽取      

3.3    isA关系补全

3.3.1 知识缺失的成因        

3.3.2 基于isA传递性的图谱补全     

3.3.3 基于相似实体的图谱补全        

3.4    isA关系纠错

3.4.1 错误的成因

3.4.2 简单的想法:知识的支持度

3.4.3 概念图谱中的抽象层级冲突

3.4.4 在概念图谱中进行消环


4     大规模百科图谱构建

4.1  百科图谱概述

4.1.1基本概述

4.1.2构建方法分类

4.2   基于单源的百科图谱构建

4.2.1半结构化知识抽取

4.2.2本体构建

4.2.3实体分类

4.2.4属性/关系填充

4.2.5知识图谱更新

4.3  基于多源的百科图谱构建

4.3.1通用本体构建

4.3.2实体对齐

4.3.3属性对齐

4.3.4属性值融合


5     众包构建

5.1  知识型众包基本概念  

5.2  知识型众包的研究问题

5.2.1What(将什么交予众包)

5.2.2Whom(将任务交予谁完成)

5.2.3How(如何完成众包)

5.3  基于众包的知识图谱构建与精化

5.3.1本体构建阶段的众包介入

5.3.2知识图谱精化阶段的众包介入

5.4  总结


6     质量控制

6.1  知识图谱质量评估与控制概述

6.1.1知识图谱质量的评估维度

6.1.2知识图谱质量的评估方法

6.1.3知识图谱质量控制的研究问题

6.2  知识图谱构建中的质量控制

6.2.1知识来源的可信度评估

6.2.2知识获取方法的可信度评估

6.2.3语义漂移问题的处理技术

6.3  知识图谱中的缺失知识补全

6.3.1关系数据库中可计量数据的补全

6.3.2关系数据库中不可计量数据的补全

6.3.3知识图谱中缺失实体的补全

6.3.4知识图谱中缺失关系的填补

6.4  知识图谱中的知识统一与修正

6.4.1关系数据库中的知识统一与修正技术

6.4.2知识图谱中的知识统一与修正技术


第三部分     知识图谱管理

1     图数据库系统

1.1  图系统与知识图谱

1.1.1为什么需要图系统

1.2  知识图谱对图系统提出怎样的需求

1.2.2图系统基本架构

1.3  典型图系统

1.3.1选择因素

1.3.2系统对比


2     建模与存储

2.1  概述

2.2  图论基础

2.3  知识图谱的逻辑表示

2.4  知识图谱的物理存储

2.5  总结


3     查询与检索

3.1  知识图谱上查询概述

3.2  查询语言:SPARQL

3.3  子结构查询

3.4  关键字查询


第四部分      知识图谱应用


1     基于知识图谱的语言理解

1.1  概述(实体、概念、主题)

1.2  实体理解(字符的实体化)

1.2.1实体识别与链接

1.3  概念理解(实体的概念化)

1.4  主题理解(概念的主题化)


2     基于知识图谱的搜索与推荐

2.1  基于知识图谱的搜索

2.1.1意图理解

2.1.2实体搜索

2.1.3实体探索

2.2  传统推荐系统的局限与挑战

2.3  基于知识图谱的物品画像

2.3.1知识融合画像的传统模型

2.3.2知识融合画像的深度学习模型

2.4  基于知识图谱的用户画像

2.4.1综合历史物品特征的用户画像

2.4.2基于概念化标签的用户画像

2.5  基于知识图谱的跨领域推荐


3     基于知识图谱的问答

3.1  知识问答概述

3.2  经典方法:基于规则的知识问答

3.3  基于深度学习的知识问答

3.4  基于语义模板学习的知识问答

3.5  混合问答及知识问答最新趋势

3.6  总结


第五部分     实践与问题


1     领域知识图谱落地实践

1.1  什么是领域知识图谱DKG

1.2  领域知识图谱与通用/开放领域知识图谱的关系是什么

1.3  为何需要符号化表示的知识图谱

1.4  为什么需要领域知识图谱

1.5  领域知识图谱系统的生命周期

1.6  领域知识图谱的知识如何表示

1.7  领域知识图谱如何构建

1.8  领域知识图谱的评价标准

1.9  领域知识图谱如何存储

1.10 领域知识图谱如何查询

1.11 领域知识图谱如何使用

1.12 领域知识图谱落地的最佳实践

1.13 领域知识图谱还存在哪些挑战


2     知识图谱中的开放问题

2.1  知识表示

2.1.1隐形知识的表达

2.1.2知识图谱语义表达能力的增强

2.2   知识获取

2.2.1大规模常识获取与理解

2.2.2样本稀疏环境下的领域知识获取

2.2.3端到端的知识获取

2.2.4知识获取中的人机协作

2.3   应用

2.3.1知识图谱与可解释人工智能

2.3.2符号知识与神经网络的融合

2.3.3知识引导下的机器学习

2.3.4知识引导下的机器语言认知

2.3.5知识引导下的搜索与推荐






主办单位

  上海财经大学信息管理与工程学院

复旦大学知识工场实验室

http://kw.fudan.edu.cn



关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。


640?

▽ 点击 | 阅读原文 | 立刻报名

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值