⬆⬆⬆ 点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
晋嘉睿,上海交通大学博士二年级年级博士生,导师为俞勇教授。研究兴趣为图数据挖掘,信息检索。
研究背景
从因子分解机(FM)谈起
交互信息的起源可以追溯到因子分解机(FM, Factorization Machines),一种在预测任务中常用的特征交叉关联算法。
在多类型数据建模中,我们通常会得到一个包括多个标签的表格,例如通过日期、性别、地点来预测购买行为。每条数据的结果不是由单个特征独立影响,而应该考虑特征与特征之间的相互关系。这其实就是“且”(and)的关系,比如当数据呈现出春节且女性且中国城市的模式时,就会出现购买行为。这种关系在建模中就是乘积(product)操作,是一种交互操作(interaction operation)。
什么是异构网络?
如果把多类别表格建模成图,就形成了异构网络图。异构图是指包含多种类型的节点和边的图,即节点和边中至少一个具有多种类型。一个异构图可以表示为G= (V, E),由对象集 V 和链接集 E 组成。以图中的电影数据为例,它包含三种类型的节点:用户(user)、电影(movie)和导演(director)。两两节点之间的边表示两个对象之间的关系,例如user-movie是rating关系,movie-director是执导关系,而user-user则是一种包含多跳的组合关系。