杰卡德相似系数

(1)两个集合A和B的交集元素在A、B的并集中所占的比例,称为两个集合的杰卡德相似系数,用负号J(A,B)表示。

         J(A,B) = |A交B| / |A∪B|

         杰卡德相似系数是衡量两个集合的相似度的一种指标。

(2)杰卡德距离:

         与杰卡德相似系数相反的概念

         = 1 - J(A,B) =( |A∪B| - |A角B| )/ |A∪B|

        杰卡德距离用两个集合中不同元素占所有元素的比例来衡量两个集合的区分度。


应用:可将杰卡德相似系数用在衡量样本的相似度上

A(0111) B(1011)  ,1表示集合包含该元素,0表示集合不包含该元素

P:样本A与B都是1的维度的个数

q :样本A是1、样本B是0的维度的个数

r:样本A是0,样本B是1的维度的个数

s:样本A与B都是0的维度的个数

A,B的杰卡德相似系数:J = P/(P+q+r)






评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值