二进制特征的相似性和非相似性度量(the Similarity Measure and Dissimilarity Measure for Binary Features)

假设我们使用两个二进制下标来计算两个对象的特征。 n 00 n_{00} n00 n 11 n_{11} n11分别代表两个对象特征同时不存在和存在, n 01 n_{01} n01 n 10 n_{10} n10代表对象特征只存在在一个对象。对于两个数据点 x i x_{i} xi x j x_{j} xj两种常见类型的相似性度量如下
S i j = n 11 + n 00 n 11 + n 00 + w ( n 10 + n 01 ) S_{ij}=\frac{n_{11}+n_{00}}{n_{11}+n_{00}+w(n_{10}+n_{01})} Sij=n11+n00+w(n10+n01)n11+n00
w = 1 , w=1, w=1, simple matching coefficient; w = 2 , w=2, w=2, Rogers and Tanimoto measure; w = 1 / 2 , w=1/2, w=1/2, Gower and Legendre measure.
这些度量直接计算两个对象之间的匹配。未匹配的对根据它们对相似度的贡献进行加权。
S i j = n 11 n 11 + w ( n 10 + n 01 ) S_{ij}=\frac{n_{11}}{n_{11}+w(n_{10}+n_{01})} Sij=n11+w(n10+n01)n11
w = 1 , w=1, w=1, Jaccard coefficient; w = 2 , w=2, w=2, Sokal and Sneath measure; w = 1 / 2 , w=1/2, w=1/2, Gower and Legendre measure.
These measures focus on the co-occurrence features while
ignoring the effect of co-absence.

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老实人小李

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值