【Python】Tanimoto相似度算法实现

公式:

  • 假设A  =  [1,2,3,4]  ,长度为4
  • 假设B  =  [1,2,5,6]  ,长度为4 
  • 则AB的公共部分C = [1,2], 长度为2
  • AB的相似度为:2 / (4 + 4 - 2) = 0.33

算法:


方法一:

#-*- coding: utf-8 -*-
#user_data为用户信息嵌套字典
#如{'fabrice' : {'water' : 3}}
def sim_tonimoto(user_data, user1, user2):
    common = {}
    #判断有没有相同的数据, 没有相同数据则返回0
    for item in user_data[user1]:
        if item in user_data[user2]:
            common[item] = 1

    if len(common) == 0:
        return 0

    common_num = len(common)
    user1_num = len(user_data[user1])
    user2_num = len(user_data[user2])

    res = float(common_num)/(user1_num + user2_num - common_num)

    return res

方法二:

def sim_tonimoto(user_data, user1, user2):
    common = [item for item in user_data[user1] if item in user_data[user2]]
    return float(len(common))/(len(user_data[user1]) + len(user_data[user2]) - len(common))




  • 1
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值