cs224w 1-2 Application of Graph ML
Different Type of Task
传统的图机器学习任务有四种:
① 节点级别
② 边级别
③ 子图级别
④ 图级别 (如图级别预测或生成图)
各个级别对应的任务:
1.Node Level–Classification:节点分类(用户分类、项目分类)
例子:蛋白质氨基酸序列,3D折叠形状复杂;给定氨基酸序列,能否预测蛋白质的3D折叠形状? AIphaFold 提升了30%的准确率。图是蛋白质,节点是氨基酸,边是氨基酸之间的关系;
2.Link Level–Predict:边的预测,概率多大等
例子1:推荐系统;节点是用户和项目,边是他们之间的关系
在网站Pinterest上给用户推荐相关物品。节点是物品和用户,图中的d是嵌入向量之间的距离,即任务目标是使相似节点嵌入之间的距离比不相似节点嵌入之间的距离更小。
例子2:药物组合副作用,药物太多种多样无法依次排列去做临床试验,故设计一个模型预测这些药物之间如何互相作用,可能引起什么样的不良反应。
两层异构网络,蛋白质–蛋白质相互作用网络,药物—药物副作用网络,药物对蛋白质的靶向作用构成了药物–蛋白质的边,任务就是:预测药物–药物之间缺失的边,会引起何种副作用。
3.Sub-Graph Level :子图任务,不同的图具有不同的属性
例子1:交通流量预测,Google Map预测一段路程的长度、耗时等:将路段建模成图,在每个子图上建立预测模型
例子2:Clustering(聚类):检测节点形成社区是否形成社区
4.1 Graph Level–classification:图分类
例子:药物发现;原子为节点,化学键为边,构建成千上万的图,预测哪些分子对某种疾病可以起到治疗作用,以便于生物学家进行实验验证其治疗效果。
4.2 Graph Level-generative:图生成 (生成药物新分子)
①生成高度相似的新分子;②优化现有分子,使其具有理想特性;
4.3 Graph Level–evolution:物理实验
将材料表示为一组粒子,粒子之间有互相作用,可以定义成一个图;预测此图将来会如何发展(即材料会如何变形等;
首先我们采用材料并将其表示为一组粒子;根据临近度和相互作用生成图;采用GNN预测未来粒子的速度和位置;将粒子演化到新的位置,再根据新的临近点,创建新的图;