Spark个性化推荐算法

本文介绍了使用Spark进行个性化推荐的实战与理论知识,包括基于Redis、Mongodb、Elasticsearch等技术的数据处理,以及基于内容和协同过滤的推荐算法实现,通过ScalaNLP进行矩阵计算,展示了如何运用TF-IDF和Elasticsearch的More like this进行相似度计算。
摘要由CSDN通过智能技术生成

实战篇
1 项目技术架构

2 项目涉及关键技术
Redis:存储用户最近评测队列
Mongdb:BI可视化查询
Elastic Search:文本关键词模糊检索索引、类别完全匹配检索、More like this基于内容推荐api
Flume:实时评测数据采集
Kafka:采集数据中间消息通道 Kafka stream:消息转发中间管道
Spark:spark sql、spark stream、spark M数据统计、加载数据源引擎、机器学习模型
ScalaNLP:JAVA矩阵计算
理论篇
1 推荐系统的意义 - 解决信息过载
搜索引擎时代
分类导航:雅虎
搜索:谷歌、百度

个性化时代(提高用户粘度、增加营收)
系统自动推荐相关的东西:今日头条、豆瓣、电商

2 推荐系统的分类
基于人口统计学的推荐

基于内容的推荐

基于协同过滤的推荐

3 基于人口统计学的推荐
基于人口统计学的推荐机制(Demographic-based Recommendation)是一种最易于实现的推荐方法,它只是简单的根据系统用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户。

4 基于内容的推荐
4.1 定义
基于内容的推荐是在推荐引擎出现之初应用最为广泛的推荐机制,它的核心思想是根据推荐物品或内容的元数据,发现物品或者内容的相关性,然后基于用户以往的喜好记录,推荐给用户相似的物品。

4.2 算法流程
对于物品的特征提取——打标签(tag)
对于文本信息的特征提取——关键词
生成分词特征向量矩阵

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值