会议交流 | 大模型与知识图谱论坛

最新推荐文章于 2025-03-18 20:54:29 发布

开放知识图谱

最新推荐文章于 2025-03-18 20:54:29 发布

阅读量487

点赞数

文章标签：知识图谱人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzU2NjAxNDYwMg==&mid=2247504863&idx=1&sn=4a93f3a24af9b949b367f252bcf4b4cf&chksm=fd34de01dba377fb2d9f5ae4da7bd22b1e5a0d711059156cd0ecaf20a3f2ac1f0a73e9216a1a&scene=126&sessionid=0

版权

为深入探讨知识图谱与大模型的现状和未来发展，DataFunSummit2024：知识图谱在线峰会将于2024年3月23日9:00-17:00线上举办，欢迎广大从业者参与交流！

扫码免费报名参加

下面是本次会议的大模型与知识图谱论坛详情：

出品人：孙常龙阿里巴巴资深算法专家

个人介绍：孙常龙，阿里巴巴通义实验室NLP应用算法负责人，拥有多篇授权专利，在顶级会议发表论文30余篇，承担国家科技部重点研发项目多项，带领团队在多项的国内外评测比赛中获得第一名，曾获高等学校科学研究优秀成果奖（科学技术）科技进步一等奖。研究方向包括机器学习、自然语言理解、文档理解等。在技术赋能业务方面，深入司法、通信、互联网等垂直领域的智能化建设，首创了司法全流程智能化审判系统，该智审模式2022年纳入社科院《法制蓝皮书》，构建了法律垂直大模型通义法睿，已经落地多家法院。

陈玉博中国科学院自动化研究所副研究员

个人介绍：陈玉博，中科院自动化所副研究员，研究方向为自然语言处理和知识图谱，在ACL、EMNLP、AAAI 等国际重要会议和期刊发表学术论文40 余篇，Google Scholar引用量5200余次，其中两篇论文入选ACL、EMNLP高影响力论文（Paper Digest评选），获ISWC 2023（CCF-B类）最佳张贴论文奖。出版学术专著两部《知识图谱》、《知识图谱：算法与实践》，由人工智能学会推荐入选十三五国家重点图书出版规划教材。连续多年在中国科学院大学主讲《知识图谱》课程，2021 年获得中国科学院大学优秀课程。主持国家自然科学基金面上项目、青年基金项目，参与国家自然科学基金重点项目、2030新一代人工智能重大项目、重点研发计划课题。主持研发的信息抽取和知识图谱构建系统多次获得国际/国内学术评测冠亚军。入选2020 年第五届中国科协青年人才托举工程、2022 年百度全球华人AI 青年学者、2022 年中国科学院青年创新促进会会员、担任中国中文信息学会青年工作委员会秘书长、COLING 2022领域主席、Data Intelligence编委等。获2018 年中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖，2019 年度北京市科学技术进步奖一等奖。

演讲题目：预训练语言模型中的知识分析、萃取与增强

演讲提纲：近年来，大规模预训练语言模型在知识密集型的自然语言处理任务上取得了令人瞩目的进步。这似乎表明，预训练语言模型能够自发地从语料中学习大量知识，并隐式地保存在参数之中。然而，这一现象的背后机理仍然萦绕着许多谜团。语言模型究竟掌握了哪些知识，如何提取和利用这些知识，如何用外部知识弥补模型不足，这些问题都亟待进一步探索。该报告将重点介绍预训练语言模型知识分析、知识萃取、知识增强等领域的基础知识和近期研究进展。

听众收益：

1.预训练语言模型中蕴含哪些知识？

2.如果从预训练语言模型中萃取知识？

3.如何增强预训练语言模型的知识？

张宁豫浙江大学副教授

个人介绍：张宁豫，浙江大学副教授，博士生导师。研究方向包括知识图谱、自然语言处理等，在知识图谱和自然语言处理领域已发表多篇顶级会议和期刊文章，包括ACL、EMNLP、NAACL、NeurIPS、ICLR等，五篇论文入选Paper Digest高影响力论文，获浙江省科技进步二等奖，国际会议IJCKG最佳论文/提名2次，CCKS最佳论文奖1次；担任ACL、EMNLP领域主席、ARR Action Editor、IJCAI 高级程序委员、ACM Transactions on Asian and Low-Resource Language Information Processing Associate Editor及NeurIPS、ICLR、ICML等会议程序委员会委员。

演讲题目：从知识图谱的视角看大模型知识编辑问题

演讲提纲：大模型是人工智能领域的一次重大突破，其成功也揭示了大规模参数化神经网络在习得和刻画世界知识上的巨大潜力。其通过将海量的、以文本序列为主的世界知识预先学习进神经网络中，并实现在参数化空间对知识进行处理和操作。知识编辑旨在通过对大模型进行精准、轻量的操作，实现对知识谬误的修正，为可信、可控、可靠的大模型应用提供了支持。本次报告将从知识图谱视角剖析现有大模型知识编辑问题，并重点分析知识冲突、知识扭曲现象和概念知识编辑问题。

听众收益：

1.什么是大模型知识编辑?

2.大模型知识编辑的知识冲突和知识扭曲现象

3.大模型概念知识编辑问题

4.开源大模型知识编辑工具EasyEdit

蒋卓人浙江大学信息资源管理系 “百人计划”研究员

个人介绍：浙江大学“百人计划”研究员，博士生导师。已在国际国内重要刊物或会议上发表60余篇高质量学术文章。主持包括国家自然科学基金、科技部重大专项子课题、国家社科重大项目子课题、国家自科重点项目子课题在内的十余项课题。担任中国人工智能学会青工委委员、中文信息学会青工委委员，以及信息检索、情感计算、社会媒体处理专委会委员。曾任阿里巴巴达摩院语言技术实验室顾问；曾获得2013年ACM/IEEE-CS Joint Conference on Digital Libraries（JCDL）Best Poster Award和多项人工智能和数据算法国际比赛冠军。研究方向包括计算社会科学，自然语言处理，信息检索。

演讲题目：利用大语言模型促进综合图学习能力

演讲提纲：虽然大语言模型已经展现出了其纯文本推理能力，但其是否可以泛化到图的学习上还未被充分探索。在本次演讲中，我们将初步回顾一下大语言模型在图上的技术应用。具体的，我们从图学习的不同场景以及大语言模型在图学习中的不同角色等角度对相关文献进行了总结。我们发现大语言模型为图上跨领域跨任务的统一学习框架发展提供了机会。最后，我们将总结在这个快速发展领域的潜在研究方向。

听众收益：

- 了解适应大语言模型的图学习的研究现状。

- 如何利用大语言模型促进跨领域数据源和不同学习任务的图学习。

- 了解这个领域的潜在研究方向。

梁家卿复旦大学大数据学院青年副研究员

个人介绍：梁家卿博士，复旦大学大数据学院青年副研究员，主要研究方向为基于知识图谱与大模型的认知智能。在国际顶级学术会议与期刊（包括TKDE，AAAI，IJCAI，ICDE等）发表论文50多篇。在应用落地方面，作为技术负责人研发并公开发布了多个知识图谱与大模型应用平台如CuteGPT、Emo-CuteGPT、CN-DBpedia、ProbasePlus、CN-Probase、“不倒翁”智能问答等，相关产品API被工业界与学术界多家单位已调用累计17亿次以上，并形成了16个专利。有成功训练百亿参数量级别模型的经验和在大规模集群上训练千亿参数量级别模型的经验。先后在国际性的“知识库构建”比赛中荣获第二名；在中国计算机学会和中国中文信息学会的主办的语言与智能技术竞赛“信息抽取”比赛中荣获第一名。主持研发的情感增强大模型 CuteGPT 在上海卓辰信息科技有限公司（帮助其情报信息知识抽取准确率达到 90%以上）、上海双地信息系统有限公司（帮助其开发了内容管理产品“小孔商业智能AI助理”）、上海光唯文化传媒有限公司（应用于其客户在新产品研发业务，新产品销售额超过千万元）等单位实现了落地应用。并且曾获ACM-ICPC区域赛金牌、TopCoder Open全球前150名、吴文俊人工智能科学技术奖科技进步奖三等奖、上海市优秀博士毕业生、上海市计算机学会优秀博士论文、华为云最佳论文复现奖、复旦大学超级博士后、上海市超级博士后、中国博士后科学基金面上资助、国家自然科学基金青年基金资助。

演讲题目：领域大模型的挑战与机遇：从构建到应用

演讲提纲：目前，GPT-4等大规模的预训练语言模型（以下简称大模型）已经获得了惊人的效果，促成了新的人工智能应用范式。然而，由于其开放性和幻觉现象，大模型在领域落地仍然遇到了诸多挑战。

事实上，大模型仍不足以也不应当整个替代现有的领域中的工作流程，而应当作为强大的人工智能工具融入其中。为此，准确定位大模型在现有工作流程中的角色和针对性地构建和增强就成为了重要的任务。

本演讲从大模型的领域适配、能力提升和协同工作三个层次，介绍和分享本团队在领域大模型构建和落地的一些实践。其目的并非提升模型的“智商”或使其在MMLU等考试中获得更高的分数，而是如何融入和赋能现有的领域应用中的工作流程，使其真正产生价值。

听众收益：

1. 大模型是否终结了知识工程？

2. 大模型和专业领域中的知识如何进行结合？

3. 大模型在领域应用中应当扮演什么角色？

4. 大模型在领域落地中遇到了哪些困难？如何一定程度缓解？

扫码免费报名观看直播