数据的距离度量 三、Jaccard距离,卡方相似度,相关系数,Dice系数

数据的距离度量 三、Jaccard距离,卡方相似度,相关系数,Dice系数

Jaccard距离

用于衡量两个集合A,B的样本相似度,距离越接近1的两个集合相似度越小:
J a c c a r d ( A , B ) = 1 − A ∩ B A ∪ B Jaccard(A,B)=1 - \frac{A \cap B}{A \cup B} Jaccard(A,B)=1ABAB

卡方相似度

用于衡量两个向量(样本)之间的相似性:
C h i − S q u a r e ( u , v ) = ∑ i 2 u i v i u i + v i , ∑ i u i = ∑ i v i = 1 Chi-Square(u,v)=\sum_i\frac{2u_iv_i}{u_i+v_i},\quad \sum_iu_i=\sum_iv_i=1 ChiSquare(u,v)=iui+vi2uivi,iui=ivi=1

相关系数

用于衡量两个样本之间的相关性:
ρ ( X , Y ) = C o v ( X , Y ) σ ( X ) σ ( Y ) \rho(X,Y)=\frac{Cov(X,Y)}{\sigma(X)\sigma(Y)} ρ(X,Y)=σ(X)σ(Y)Cov(X,Y)

Dice系数

常用于语义分割,用于度量两个集合的相似性:
D i c e ( A , B ) = 2 ∣ A ∩ B ∣ ∣ A ∣ + ∣ B ∣ Dice(A,B)=\frac{2|A\cap B|}{|A|+|B|} Dice(A,B)=A+B2AB

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值