![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法模型
蓝翔厨师长
AI量化算法工程师
展开
-
基于领域的协同过滤——推荐系统surpriseKNN家族
基于领域的协同过滤主要有两种:UserCF、ItemCF基于用户的协同过滤(UserCF)利用用户的相似度来计算用户的相似度step1:找到和目标用户兴趣相似的用户集合,用Jaccard相似度、余弦相似度等相似度计算方法;step2:用户u对物品i的相似度,等价于K个邻居对物品i的兴趣度;step3:把和用户兴趣相同的k个邻居喜欢的物品进行汇总,去掉用户u已经喜欢过的物品,剩下的按照从大到小进行推荐。基于物品的协同过滤(ItemCF)利用用户行为相似度计算物品的相似度:step1:计算物品之原创 2020-11-15 14:05:00 · 1309 阅读 · 0 评论 -
推荐系统矩阵分解surprise——奇异值分解(Singular Value Decomposition,SVD)及SVD家族(FunkSVD、BisaSVD,SVD++)
奇异值分解为矩阵分解的一种方法。奇异值分解(SVD)将目标矩阵A,转化为三个矩阵相乘,如下:其中,A为目标矩阵,表示user对item的打分;P为左奇异矩阵,mm维,为User矩阵;Q为右奇异矩阵,nn维,为item矩阵;Λ为对角矩阵,对角线上的非零元素为特征值λ1, λ2, … , λk。thinking:Λ矩阵需要由矩阵A求得,这就需要矩阵A是一个非稀疏矩阵,而现实中,就是因为矩阵A的未知元素太多,我们才做预测并推荐,所以SVD在推荐系统中反而不太使用,但可运用到图片压缩(降维)。SVD图原创 2020-11-11 11:42:15 · 1702 阅读 · 0 评论 -
surprise推荐系统工具-Baseline算法、Slope One算法详解及movieLens案例
surprise推荐系统工具surprise推荐系统工具下有很多推荐算法:本文主要讲一下Baseline算法和SlopeOneBaseline算法论文地址:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.476.4158&rep=rep1&type=pdfBaseline算法是一种基于统计基准分数进行预测的算法。bui为预测值;u为均值;bu为用户偏好;bi为商品差异。结合原文进行解释。1.我们知道所有原创 2020-11-08 16:42:12 · 1235 阅读 · 0 评论 -
推荐算法-矩阵分解(Matrix Factorization,MF)
常用的推荐算法基于协同过滤的推荐算法是主流思想之一;基于模型与基于领域的推荐算法之间的区别为:基于领域的协同过滤是将用户的数据读入到内存中进行运算,也称为基于内存的协同过滤(Memory-based)。数据量少的情况下,可以在线实时推荐;基于模型的推荐(Model-based),采用机器学习的方式,分成训练集和测试集。离线训练时间比较长,但训练完成后,推荐过程比较快。隐语义模型是指通过挖掘用户与物品之间的隐含联系,从而对用户进行推荐。一、矩阵分解是什么?如上表所示,是一个user-item的评原创 2020-11-06 15:03:18 · 6908 阅读 · 1 评论 -
SimpleTagBased算法(基于用户标签做推荐)
一、SimpleTagBased算法简介step1:统计每个用户的常用标签;step2:对每个标签,统计被打过这个标签次数最多的商品;step3:对于某一个具体用户,找到他最常用的标签,将这些标签最热门的物品推荐给他;step4:排序推荐。排序得分公式如下:针对用户1排序如下:得分= 用户1使用标签t的次数(n)*商品i被打过标签t的次数(n)二、数据结构化针对三个变量(user,item,tag)的数据结构,对其定义如下:用户打标签记录:record[i] = {user,item,原创 2020-11-05 10:46:27 · 1548 阅读 · 0 评论 -
聚类算法(EM,Expectation Maximization)原理及聚类(GMM,GaussianMixture)实战——python
聚类算法原理简介(EM)EM聚类原理如其名称所示,EM聚类主要是两个步骤,一是期望步骤(Expectation);二是最大化步骤(Maximization)。thinking:一个西瓜分给两个人,怎么才能切的合理?第一步是随机切一刀,观察预期,这就是期望步骤(Expectation);第二步是如果存在偏差,需要重新评估如何切,即重新评估参数,这就是最大化步骤(Maximization)。EM算法是一种求解最大似然估计的方法,通过观测样本,来找出样本的模型参数。通过EM算法中的E步来进行观察,然后通过原创 2020-11-03 18:39:55 · 2405 阅读 · 0 评论 -
机器学习之朴素贝叶斯(Naive Bayes)一
这里写自定义目录标题贝叶斯分类器原理三个重要知识点训练朴素贝叶斯的过程朴素贝叶斯分类器贝叶斯分类器原理已知样本集,求新样本的分类结果:比较各个分类结果下,哪个后验概率大,后验概率大的便是分类结果三个重要知识点先验概率:通过经验来判断事情发生的概率后验概率:根据事情发生的结果,来推测原因的概率条件概率:指事件A在事件B发生的前提下发生的概率,记为P(A|B)后验概率公式为:(朴素贝叶斯分类器主要运用到的公式)训练朴素贝叶斯的过程step1.给出训练数据step2.计算类别概率和条件概率原创 2020-10-24 19:29:43 · 255 阅读 · 0 评论