推荐系统
水木流年追梦
清华大学计算机研究生,专研算法工程
展开
-
推荐系统用户行为分析
用户行为分析很多关于互联网数据的研究发现,互联网上的很多数据分布都满足一种称为Power Law的分 布,这个分布在互联网领域也称长尾分布。为了说明用户行为的长尾分布,我们选择Delicious和CiteULike数据集一个月的原始数据进行 分析。这里,我们没有用Netflix或者MovieLens数据集是因为这两个数据集都经过了人为的清理, 被清除了很多稀疏的数据,所以它们的分布不能反映网站的真实分布。图2-3展示了Delicious和 CiteULike数据集中物品流行度的分布曲线。横坐标是原创 2020-07-30 13:39:15 · 885 阅读 · 0 评论 -
推荐算法工程师之路
推荐系统工程师技能树掌握核心原理的技能数学:微积分,统计学,线性代数 周边学科:信息论基础 推荐算法:CF,LR,SVM,FM,FTRL,GBDT,RF,SVD,RBM,RNN,LSTM,RL 数据挖掘:分类,聚类,回归,降维,特征选择,模型评价实现系统检验想法的技能:操作系统:Linux 编程语言:Python/R, Java/C++/C,sql,shell RPC框架:thrift, Dubbo,gRPC web服务:tornado, django, flask 数据存储:r原创 2020-07-30 09:41:52 · 1074 阅读 · 0 评论 -
推荐系统实战第二部分 评价指标
评测指标用于评价推荐系统各方面的性能。有些可以定量计算,有些只能定性描述,有些可以通过离线实验计算,有些需要通过用户调查获得,还有些只能在线评测。预测准确度预测准确度度量一个推荐系统或者推荐算法预测用户行为的能力。这个指标是最重要的推荐系统离线评测指标。在计算该指标时需要有一个离线的数据集,该数据集包含用户的历史行为记录。然后,将该数据集通过时间分成训练集和测试集。最后,通过在训练集上建立用户的行为和兴趣模型预测用户在测试集上的行为,并计算预测行为和测试集上实际行为的重合度作为预测准确度。主原创 2020-06-13 00:35:56 · 668 阅读 · 0 评论 -
推荐系统实战第一部分 协同过滤
1.协同过滤1.1基于用户的协同过滤算法包含两个步骤:a. 计算用户之间的相似度:找到和目标用户兴趣相似的用户集合。b. 根据用户相似度及用户对物品的评价为物品打分:找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。Step1: 计算用户相似度根据协同过滤算法的定义,这里主要是利用用户行为的相似度来计算兴趣的相似度。给定用户u和用户v,令N(u)和N(v)分别表示用户u和用户v曾经有过正反馈的物品集合,则有如下三种方式计算相似度:Jaccard公式余弦相似度原创 2020-06-12 23:12:06 · 453 阅读 · 0 评论