基于用户的协作性过滤推荐系统(为用户推荐影片)

#!/usr/bin/env python 
#coding=GBK
import chardet
from math import sqrt   

#电影打分, ltl对a电影打了4.3分.....
critics = {'ltl':{'a':4.3, 'b': 3.5, 'c': 4.7}
            ,'oyl':{'a': 4.3, 'b': 3.5, 'd': 3.0, 'e':4.2}
            ,'ygq':{'b': 3.2, 'c': 2.7, 'd': 4.1, 'f':2.1}
            ,'mmm':{'a': 2.3, 'd': 4.3, 'e': 1.9}
            }
#求person1, 和perso2之间的相似度
def sim_distance(prefs, person1, person2):
    dis = 0
    for item in prefs[person1]:
        if item in prefs[person2]:
            dis += (pow(prefs[person1][item] - prefs[person2][item], 2))
            
    return 1 / (1 + sqrt(dis))
   
#跟我相似度最大的前n个人
def topMatchs(prefs, person, n = 5, similarity = sim_distance):
    scores = [(similarity(prefs, person, other), other)for other in prefs if other != person]
    scores.sort()
    scores.reverse()
    return scores[0:n]
#对没有看过的电影打分
def getRecommendations(prefs, person, similarity = sim_distance):
    totals = {}
    simSums = {}
    for other in prefs:
        if other == person:
            continue
        sim = similarity(prefs, person, other)
        if sim <= 0:
            continue
        for item  in prefs[other]:
            if item not in prefs[person]:
                totals.setdefault(item, 0)
                totals[item] += (sim * prefs[other][item])
            
                simSums.setdefault(item, 0)
                simSums[item] += sim
    ranks = [(total / simSums[item], item) for item, total in totals.items()]
    ranks.sort()
    ranks.reverse()
    return ranks
    

ranks = getRecommendations(critics, 'ltl')
for item, item2 in ranks:
    en = chardet.detect("item2")['encoding']
    print item2, ":", item

   



参靠:集体智慧

由于自己手头没有数据, 这本书上推荐了一个影片打分的数据http://grouplens.org/node/73, 一共有10万行打分情况; 请自行下载并导入执行

强烈推荐这本书, 入门真的很好


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值