2.1 推荐系统要素
(1)UI和UE (前端界面)
(2)数据 (Lambda架构)
(3)业务知识
(4)算法
2.2 推荐系统架构
把flume的数据转到hdfs上
Lambda架构介绍
(1)离线计算和实时计算共同提供服务的问题
(2)离线计算优缺点
优点是能够处理的数据量可以很大 比如pb级别
缺点 速度比较慢 分钟级别的延迟
(3)实时计算
优点是响应快,来一条数据处理一条ms级别响应
缺点 处理的数据量少一点
(4)离线计算的框架
hadoop,spark core,spark sql,hive
(5)实时计算框架
spark streaming,storm,flink
(6)消息中间件
flume