基于局部信息的节点相似性指标
对于一般的网络,两个节点的共同邻居的数量越多,这两个节点越相似,也就更倾向于相互连接。
- 其中: Γ ( x ) \Gamma (x) Γ(x) 为节点x的邻居节点的集合
- k ( x ) = ∣ Γ ( x ) ∣ k(x)=\left | \Gamma (x) \right | k(x)=∣Γ(x)∣为节点x的度
1.共同邻居(CN)
S x y = ∣ Γ ( x ) ∩ Γ ( y ) ∣ Sxy=\left | \Gamma (x)\cap \Gamma (y) \right | Sxy=∣Γ(x)∩Γ(y)∣
- 以下2~7是直接基于共同邻居指标的不同的规范化而来的
2.Salton指标
S x y = ∣ Γ ( x ) ⋂ Γ ( y ) ∣ k ( x ) × k ( y ) Sxy=\frac{\left | \Gamma (x)\bigcap \Gamma (y) \right |}{\sqrt{k(x)\times k(y)}} Sxy=k(x)×k(y)∣Γ(x)⋂Γ(y)∣
*3.Jaccard指标
- 用于比较有限样本集之间的相似性与差异性
- Jaccard值越大,样本相似度越高
- J(A,B)∈[0,1]
- 计算对象间距离,用于数据聚类等
- 比较文本相似度,用于文本查重与去重
S x y = ∣ Γ ( x ) ∩ Γ ( y ) ∣ ∣ Γ ( x ) ∪ Γ ( y ) ∣ = ∣ Γ ( x ) ∩ Γ ( y ) ∣ ∣ Γ ( x ) ∣ + ∣ Γ ( y ) ∣ − ∣ Γ ( x ) ∩ Γ ( y ) ∣ Sxy=\frac{\left | \Gamma (x)\cap \Gamma (y) \right |}{\left | \Gamma (x)\cup \Gamma (y) \right |}=\frac{\left | \Gamma (x)\cap \Gamma (y) \right |}{\left | \Gamma (x) \right |+\left | \Gamma (y) \right |-\left | \Gamma (x)\cap \Gamma (y) \right |} Sxy=∣Γ(x)∪Γ(y)∣∣Γ(x)∩Γ(y)∣=∣Γ(x)∣+∣Γ(y)∣−∣Γ(x)∩Γ(y)∣∣Γ(x)∩Γ(y)∣
- 相关指标—Jaccard距离:描述集合之间的不相似性,距离越大,相似度越低
d j ( A , B ) = 1 − J ( A , B ) dj(A,B)=1-J(A,B) dj(A,B)=1−J(A,B)
4.Sorenson指标
S x y = 2 ∣ Γ ( x ) ∩ Γ ( y ) ∣ k ( x ) + k ( y ) Sxy=2\frac{\left | \Gamma (x)\cap \Gamma (y) \right |}{ k (x)+ k (y) } Sxy=2k(x)+k(y)∣Γ(x)∩Γ(y)∣
5.大度节点有利指标(HPI)
S x y = ∣ Γ ( x ) ∩ Γ ( y ) ∣ m i n { k ( x ) , k ( y ) } Sxy=\frac{\left | \Gamma (x)\cap \Gamma (y) \right |}{ min\left \{ k (x), k (y) \right \} } Sxy=min{k(x),k(y)}∣Γ(x)∩Γ(y)∣
6.大度节点不利指标(HDI)
S x y = ∣ Γ ( x ) ∩ Γ ( y ) ∣ m a x { k ( x ) , k ( y ) } Sxy=\frac{\left | \Gamma (x)\cap \Gamma (y) \right |}{ max\left \{ k (x), k (y) \right \} } Sxy=max{k(x),k(y)}∣Γ(x)∩Γ(y)∣
7.LHN-I指标
S x y = ∣ Γ ( x ) ∩ Γ ( y ) ∣ k ( x ) × k ( y ) Sxy=\frac{\left | \Gamma (x)\cap \Gamma (y) \right |}{ k (x)\times k (y) } Sxy=k(x)×k(y)∣Γ(x)∩Γ(y)∣
8.优先链接指标(PA)
S x y = k ( x ) × k ( y ) Sxy= k (x)\times k (y) Sxy=k(x)×k(y)
基于全局信息的节点相似性指标
1.局部路径指标(LP)
- 在CN的基础上考虑三阶邻居的贡献
- 其中 α \alpha α为可调节参数,A为网络的邻接矩阵
- ( A n ) x y (A^{n})xy (An)xy:节点x和y之间长度为n的路径数
- 当
α
\alpha
α=0时,LP指标就等于CN指标
S = A 2 + α A 3 S= A^{2}+\alpha A^{3} S=A2+αA3
用到再补充。。。。
2.Katz指标
- 考虑所有路径数,对越短的路径赋予越大的权重