北大张铭教授:基于知识图谱的机器学习

北京大学计算机系教授张铭在AI科技女性专题论坛上分享了基于知识图谱的机器学习研究,探讨如何利用知识图谱增强机器学习的可解释性和效果。他提出,知识图谱能提供背景知识,降低文本挖掘的标注成本,提高文本分类和其他机器学习任务的准确性。此外,他还展示了如何构建基于知识图谱的可解释推荐系统。
摘要由CSDN通过智能技术生成

AI TIME欢迎每一位AI爱好者的加入!

前言:

尽管人工智能依靠机器学习和深度学习取得了快速进展,但严重依赖于人类的监督以及大量的标注数据,成本高昂,且缺乏可解释性。图灵奖获得者、知识工程鼻祖费根鲍姆曾强调过知识中蕴含的巨大力量,单单依靠统计模式、而缺乏符号化知识结构的人工智能,离强人工智能仍具有较大差距。如何利用丰富的背景知识实现机器认知?如何打开AI的黑箱、提高智能系统的可解释性,从而促进智能决策的落地?知识图谱和机器学习的结合或许会是上述问题的答案。

6月21日北京智源大会“AI科技女性”专题论坛上,北京大学计算机系教授、AI 2000上榜学者张铭介绍了自己在基于知识图谱的机器学习研究中的成果和心得。从文本挖掘的经典模型、到基于知识图谱的拥有常识的文本表示及模型、再到可解释的推荐系统,相信张铭教授的报告会让大家对这些问题有更深入的思考并且收获满满。

★ 讲者简介 ★

张 铭,北京大学计算机科学技术系教授,博士生导师,ACM Education Council唯一的中国委员兼任中国ACM教育专委会主席,ACM/IEEE CC2020计算机学科规范执委。自1984年考入北京大学,分别获得学士、硕士和博士学位。研究方向为文本挖掘和机器学习。目前主持国家科技部科技创新2030——“新一代人工智能”重点研发项目课题、国家自然科学基金面上项目等。合作发表科研学术论文200多篇,谷歌学术被引8700余次,H因子36,获得机器学习顶级会议ICML 2014最佳论文奖、网络信息处理顶级会议WWW 2016最佳论文提名。合作发表的网络嵌入模型LINE是2015-2019五年中WWW被引数最高的论文(目前被引超过2300余次)。入选“全球2000位最具影响力AI学者”,主要贡献为信息检索与推荐领域。主编多部教材,其中2部教材为国家“十一五”规划教材,《数据结构与算法》获北京市精品教材奖并得到国家“十二五”规划教材支持。主讲的《数据结构与算法》,入选为国家级和北京市级精品课程、国家级精品资源共享课程、国家精品在线课程。

一、文本挖掘经典任务:文本分类

文本分类首先需要人工标注文档,然后对这些做好标签的文本进行训练,用来预测新文本的类别。标注工作非常耗时,而且一般需要专家进行。为表达这些文本信息,最常用的一种简化模型就是词袋模型(bag-of-words model):将文本视为若干词语的集合,忽略文法及词序,将词频作为训练分类器的特征。

然而,文本信息是一种非常经典的蕴含大量知识的信息形式。因此,如果仅使用词袋模型,文本分类的质量不会很好。比如下面这段文本中,“game”表示体育还是游戏比赛,要从上下文语境

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值