百度周景博:POI知识图谱的构建及应用

不到现场,照样看最干货的学术报告!

嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。


人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会,百度为支持单位,读芯术、PaperWeekly为合作自媒体。“AI未来说·青年学术论坛”第十一期“信息检索与知识图谱”专场已于2019年11月24日下午在中科院举行。百度周景博为大家带来报告《POI知识图谱的构建及应用》。

周景博全场报告视频

周景博,现任百度研究院商业智能实验室资深研究员。主要从事数据挖掘和机器学习相关的研究工作,研究方向包括时空数据分析和知识图谱等。周景博2014年从新加坡国立大学获得博士学位,毕业后曾任职于新加坡国立大学人工智慧系统研究院,随后于2015年底加入百度。他目前已经有多篇论文发表在计算机顶级会议和期刊上,包括SIGMOD, KDD, ICDE, TKDE, AAAI等。

报告内容:兴趣点(Point of Interest, POI) 是地图中能够提供信息和服务的位置点的总称,是构成电子地图的核心元素之一。通过构建POI知识图谱,对POI的描述语义和关系语义进行增强和优化,对建模真实世界、理解服务场景和更加智能化的辅助用户决策具有重要意义。POI知识图谱在搜索、推荐以及出行等位置相关服务中都发挥着重要作用。本次报告中周景博老师将介绍POI知识图谱构建和应用过程中的机遇与挑战,以及在这个领域的探索成果。

POI知识图谱的构建及应用

周景博老师首先简要介绍了自己的研究工作,即POI知识图谱工作。研究背景可以概括为,基于百度的大量时空大数据(比如,地图检索、移动端检索和相关定位数据等),通过机器学习、机器挖掘等人工智能技术来实现移动认知计算,增强对现实物理世界的理解。本次报告主要分为三部分:首先是背景简介,二是正在进行的POI知识图谱构建的基础研究工作,三是目前正在探索的应用。

POI指的是兴趣点,其中地图是非常核心的要素,地图中任何一个实体都可以作为POI,比如餐馆、酒店、旅游景点等都是POI。要做POI知识图谱,需要从两个角度出发,一方面是如何增强POI属性的描述。之前POI的相关工作更注重位置和名称等的构建,而在POI知识图谱中,需要强化POI的更多属性,比如人群属性、内容属性等。另一方面是需要建立POI之间的关系,特别是竞争关系。POI知识图谱目前已经在地图上取得了一些应用,对于不同场景,比如景点搜索、停车场搜索等,都可以帮助我们提高信息浏览效率。

周景博老师重点讲述了近期发表在KDD2019上的优化POI上的Tag质量的工作。通过对POI的特征词串(Tag)的抽取,可以挖掘出其构成要素之间的相互关系,打破了各网络所存在的信息孤岛。POI的Tag有非常多挖掘方法,可以简单归类为两种:一种是基于数据挖掘算法的提取,从评论、新闻、公众号等文本中尝试提取相关Tag;另外一种是人工标注。这两种方法是现在POI的Tag的主要来源。

上述方法都有两个共同的缺点,第一是信息不足。有很多POI没有足够多的评论信息或者描述信息。在地图上几千万个POI中,可能只有20%的POI的评论信息比较丰富,其他POI则没有太多的描述信息。所以需要使用更多方法增加对POI理解。第二是模型本身不准确,或者用户标注会引入错误。

POI的tag优化任务的核心是通过机器学习方法提高POI Tag的准确性。如何提高实体标注的准确性,也是知识图谱领域中经常研究的一个问题。该模型简单来讲,就是从POI基础属性、POI用户画像、用户检索信息中抽取相关特征,然后通过机器学习方法建模,来优化提高POI Tag的质量。

接下来周景博老师简要介绍了POI Tag的特征提取方法。通过统计特定POI的用户的分布,我们可以区分出不同POI的人群特点。比如,对于儿童游乐园和酒吧,他们的用户分布属性是完全不一样的。

其次是从图的角度来抽取POI tag的特征。如果很多用户既搜索了POI A也搜索了POI B,这样两个POI之间有很多共同检索。通过这种信息,我们可以建立POI的搜索图。通过搜索图,我们进一步可以统计到一个用户在搜索一个POI时,还搜索了哪些其他POI。比如,用户在搜索星巴克的时候,我们可以看到用户还会搜索电影院、酒吧、咖啡馆等其他的POI。POI之间的关联可以通过建立Tag分布统计图方式来呈现。

POI Tag优化方法的核心是优化POI-tag矩阵,包括矩阵去噪和矩阵补全等操作。对于此问题可以使用三种框架,一个是NMF(Non-negative matrix factorization),一个是Parir—wise 相似匹配,一个是ML

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值