基于内容推荐python_基于内容推荐(CB)的推荐算法

本文详细介绍了基于内容推荐的原理和步骤,包括内容分析、用户画像生成、推荐策略等。通过TF-IDF等方法对物品和用户兴趣进行表示,使用余弦相似度计算推荐相关性。该方法适用于已有用户行为数据的场景,但存在新用户冷启动和内容新颖度不足的问题。
摘要由CSDN通过智能技术生成

基于内容推荐概要

基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。主要是从两个方法来描述基于内容的推荐方法:启发式的方法和基于模型的方法。启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型。一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算,跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征,并使用这些关键字作为描述用户特征的向量;然后再根据被推荐项中的权重高的关键字来作为推荐项的属性特征,然后再将这个两个向量最相近的(与用户特征的向量计算得分最高)的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时,一般使用的是cosine方法,计算两个向量之间夹角的cosine值。

基于内容推荐的步骤

1、对数据内容分析,得到物品的结构化描述

2、分析用户过去的评分或评论过的物品的,作为用户的训练样本

3、生成用户画像

a.可以是统计的结果(后面使用相似度计算)

b.也可以是一个预测模型(后面使用分类预测计算)

4、新的物品到来,分析新物品的物品画像

5、利用用户画像构建的预测模型,预测是否应该推荐给用户U

a.策略1:相似度计算

b.策略2:分类器做预测

6、进一步,预测模型可以计算出用户对新物品的兴趣度,进而排序

7、进一步,用户模型在变化,通过反馈更新用户画像(用户画像在这

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
首先,需要了解Paillier同态加密算法的基本原理和加密、解密操作。Paillier同态加密算法是一种公钥加密算法,主要用于加密整数和实数,具有同态加密的特性,即两个密文相乘等于对应明文相加,两个密文相加等于对应明文相乘的性质。 求集合交集的过程可以使用Paillier同态加密算法实现。假设有两个集合A和B,其中A={a1,a2,...,an},B={b1,b2,...,bm},现在要求A和B的交集。 具体实现步骤如下: 1. 生成两个随机的质数p和q,计算n=p*q。 2. 计算λ=lcm(p-1, q-1),其中lcm表示最小公倍数。 3. 随机选择一个整数g,使得g^n mod n^2=1。 4. 公钥为(n,g),私钥为(p,q,λ)。 5. 对A和B中的每个元素进行加密得到密文,即将ai和bj分别加密得到ci和dj。加密过程如下: a. 选择一个随机整数r,使得r<n,计算c=g^ar * h^m mod n^2,其中h=g^m mod n^2,m为ai或bj。 b. 将密文ci或dj定义为(c,r),其中c为加密结果,r为随机数。 6. 对密文ci和dj进行同态相乘得到密文ei=ci * dj。 7. 对密文ei进行同态解密得到明文mi,即ei^λ mod n^2=(1+n)^mi * n * u,其中u为n的逆元。 8. 对每个明文mi进行判断,如果mi不等于1,则说明ai和bj在两个集合的交集中。 9. 将所有交集中的元素输出即可。 下面是Python代码实现: ```python from Crypto.Util.number import getPrime from random import randint # 生成质数p和q def generate_prime(): p = getPrime(128) q = getPrime(128) while p == q: q = getPrime(128) return p, q # 计算lcm def lcm(a, b): return a * b // gcd(a, b) # 计算逆元 def inv(a, n): t, r = 0, n newt, newr = 1, a while newr != 0: quotient = r // newr t, newt = newt, t - quotient * newt r, newr = newr, r - quotient * newr if r > 1: return None if t < 0: t += n return t # 加密明文 def encrypt(m, n, g): r = randint(0, n-1) h = pow(g, m, n*n) c = (pow(g, r, n*n) * pow(h, 1, n*n)) % (n*n) return (c, r) # 同态相乘 def multiply(c1, c2, n): return ((c1[0] * c2[0]) % (n*n), (c1[1] * c2[1]) % n) # 同态解密 def decrypt(c, p, q): n = p * q lamda = lcm(p-1, q-1) u = inv(pow(p, q-2, q) * (p-1) // lamda, q) return (((pow(c[0], lamda, n*n) - 1) // n) * u) % q # 求集合交集 def intersection(A, B, n, g, p, q): C = [] for a in A: ca = encrypt(a, n, g) for b in B: cb = encrypt(b, n, g) ei = multiply(ca, cb, n) mi = decrypt(ei, p, q) if mi != 1: C.append(a) return C # 测试 if __name__ == '__main__': p, q = generate_prime() n = p * q lamda = lcm(p-1, q-1) g = n + 1 A = [1, 2, 3, 4] B = [3, 4, 5, 6] C = intersection(A, B, n, g, p, q) print(C) ``` 在以上代码中,A和B分别表示两个集合,n、g、p、q分别表示公钥和私钥中的参数。函数intersection用于求两个集合的交集,返回结果为C。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值