- 同济子豪兄CS224github zihao_course/CS224W at main · TommyZihao/zihao_course · GitHub
- dgl库 Deep Graph Library
-
图机器学习导论
- 图(graph/network):描述关联数据的通用语言
-
图无处不在
-
如何对带关联的图数据进行数据挖掘
- 传统机器学习
- 数据样本之间独立同分布
- 全连接神经网络、卷积神经网络(CS231)、循环神经网络(CS224)、Transformer
- 图机器学习
- 任意尺寸输入
- 无固定顺序和参考锚点
- 动态变化和多模态特征
- 传统机器学习
-
图神经网络
-
图表示学习
- 端到端(end to end) 无需人工特征
- 图嵌入 graph embedding
- 结点→包含节点语义信息的d维嵌入向量
-
图数据可视化
- g6.antv.antgroup.com 蚂蚁金服
- echarts可视化 百度
-
-
图机器学习应用
-
能解决的问题
- 最短路径搜索查找
- 节点重要度(搜索引擎 Page rank)
- 社群检测
- 链接预测(推荐可能认识的人、商品推荐系统)
- 节点相似度分析
- 图嵌入
-
图机器学习任务
- 节点分类
- 链接预测
- 图分类
- 聚类:社会群体探测
- 图生成:药物生成
- 图演化:例子模拟
-
推荐系统
-
药物联合副作用
-
图背后的商业价值
- read papers
- connected papers
- https://liuhuanyong.github.io 刘焕勇 知识图谱
-
-
思考题
- 哪些APP用到了图网络:淘宝、京东、拼多多、QQ、支付宝、QQ浏览器——个性化体检系统
- 亚马逊 腾讯 阿里巴巴
-
图的基本表示
- 图是由节点(nodes/vertices)、连接(links,edges)组成
-
图的分类
-
图的本体设计
- 本体图 Ontology:针对某一类问题的图结构的通用模板
- 本体图的设计根据待解决的问题具体分析
-
图的种类
-
无向图
- 对称
-
有向图
-
异质图
- 节点/链接类型不同
- 二分图
- 二分图的展开
-
有权图
-
无权图
-
self-loops:自连接
-
Multigragh:多通路
-
-
节点连接数
-
度:相邻节点的个数/一个节点具有边的个数
- 无向图
- 平均度= \(\frac{1}{N}\sum_{i=1}^{N}k_i=\frac{2E}{N}\)
其中,E是边的个数
- 无权图/有权图同理
- 平均度= \(\frac{1}{N}\sum_{i=1}^{N}k_i=\frac{2E}{N}\)
- 有向图
- in-degree:指向节点的边的个数
- out-degree:从节点指出的边的个数
- 平均度= \(\frac{E}{N}\)
- \(\overline{k^{in}}=\overline{k^{out}}\)
- 无向图
-
-
图的基本表示
-
邻接矩阵
-
无向图
- 对称矩阵
- 某个节点的度:该节点所在行的数值之和(边用数值1表示的情况下)
-
有向图
- 非对称矩阵
- in degree: 按行求和
- out degree:按列求和
-
-
连接列表:只记录存在连接的节点对
- 解决了稀疏矩阵占用内存极大的问题
-
邻接列表
- 解决了稀疏矩阵占用内存极大的问题
-
-
图的连通性
- 无向图中:
-
connected graph:图内任意两节点可被一条路径连接
-
disconnected graph:图内存在两节点不可被一条路径连接
- connected components:虽然图内存在两节点不可被一条路径连接,但其某一部分内任意两节点可被一条路径连接,其中最大的component称之为giant component
- isolated node:孤立的点
-
- 有向图中:
- strongly connected directed graph 任意两点可触达
- strongly connected components 强连通域
- weakly connected directed graph 存在两点不可出触达(且转换成无向图是connect的)
- strongly connected directed graph 任意两点可触达
- 无向图中:
-
-
Networkx实战
- 数据集:Facebook Large Page-Page Network Data Set
- Facebook上验证过的官方页面之间互相点赞的关系构成的无向图
- 节点代表官方Facebook页面
- 链接表示这些页面之间的相互点赞关系
- 政客、政府组织、电视节目、公司
- TODO
- 节点:节点多分类、链接:链接预测、图: 社群发现
-
数据可视化
-
数据特征
-
节点特征
- 度 709 向心度 0.1778
-
连接特征
- 路径特征、局部连接特征
-
图特征
-
CS224W学习笔记
于 2023-02-14 12:44:16 首次发布