![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
番茄哈哈
大家有什么问题可以提,看到了就会回复,可以一起讨论问题呀,会不定时更新博文,内容不定,时间不定,嘻嘻嘻
展开
-
Spark(一):基于物品的协同过滤推荐算法原理介绍及Python代码解读
基于物品的协同过滤算法的原理: 基于物品的协同过滤算法给用户推荐那些和他们之前喜欢的物品相似的物品。不过ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算用户之间的相似度,也就是说物品A和物品B具有很大的相似度是因为喜欢物品A的用户大都也喜欢物品B(这一点也是基于物品的协同过滤算法和基于内容的推荐算法最主要的区别)。同时,基于物品的协同过滤...原创 2018-07-23 17:27:40 · 4766 阅读 · 3 评论 -
Spark(二):基于物品的协同过滤推荐算法Spark并行化实现(Spark环境配置,实现代码以及解读)
在前面的文章中,我已经大致讲解了基于物品的协同过滤算法(itemCF)的原理以及在Python上的实现,实现的机制主要使用串行化,耗时长,响应慢,难以适应现实大数据的需求。本文主要讲解itemCF算法在Spark上的并行化实现以便更适合用途以及提高性能。本文主要内容:1.Spark介绍。2.Spark环境配置。3.算法实现的基本流程(附流程图)4.代码分步详解。5.完整代码...原创 2018-07-26 11:25:02 · 7158 阅读 · 4 评论 -
Spark(三):基于物品的协同过滤推荐算法持久化实现
上一篇我们已经讲到如何在spark上实现算法的并行化,并且已经能够成功的在Spark平台上运行,根据指定的用户id得出相应的推荐结果。本篇文章要讲的是如何实现算法的持久化。本篇内容:1.实现持久化的原因。2.如何实现持久化。3.实现代码。1.实现持久化的原因。我们在开发或者使用算法的时候,我们要从本地读取数据,这个数据是不变的,因此实现持久化就显得没那么重要。但是当我们的工...原创 2018-07-30 10:11:46 · 1068 阅读 · 0 评论 -
Spark(四):批量推荐用户的实现(串行化,并行化实现)
到目前为止,前面三篇文章我们已经讲过了基于物品协同过滤的原理,算法在Spark平台上的并行化实现,算法的持久化实现。前面得到的推荐结果只是根据特定的一个用户推荐相应物品,本篇要讲的是在Spark平台上实现批量推荐用户,包括串行化与并行化的实现。本篇内容:1.批量推荐串行化实现(略讲)2.批量推荐并行化实现(详)3.实现代码4.两种方式结果对比1.串行化实现批量推荐,就是...原创 2018-07-30 15:54:54 · 1782 阅读 · 1 评论