笔记 | 推荐系统 —— lambda架构

【编程开发】某风网 大数据推荐系统算法工程师 项目实战
在这里插入图片描述

1 Lambda架构

1.Lambda系统架构提供了一个结合实时数据和Hadoop预先计算的数据环境的混合平台,以提供一个实时的数据视图。
2.分层架构:批处理层、实时处理层、服务层
在这里插入图片描述
一些框架:
在这里插入图片描述

应用举例

应用举例

2 批处理层

批处理层
1.数据不可变
2.可以进行任何计算
3.水平扩展——数据量大
4.高延迟——根据计算量和数量不同,运行时间可能几分钟到几个小时
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
HDFS不适合存储大量的小文件,适合连续的流式的访问。HBASE 满足随机的访问,满足海量数据的存储。二者互补

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
存储量比较大可以考虑HBASE,但是不能汇总,属于NoSQL;
Cassandra数据NoSQL,没有固定的主节点,就是挂掉一个节点也没有关系;
Impala满足前段交互式的访问,mpp架构;
Redis、memcache高效推送、展现,但是可靠性不高,Redis相对好一些;
MySQL关系型数据库

3 实时处理层

在这里插入图片描述
1.流式处理:storm
2.持续计算
3.存储和分析某个窗口的数据:比如5分钟内
4.最终确定性:有些算法很难实时计算,此时采用估计值即可
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
批处理层与实时处理层的视图存储数据库相同

4 服务层

1.支持随机读
2.需要在非常短的时间内返回结果
3.读取batch layer 和 speed layer结果,并对其归并

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值