什么是lambda架构?
lambda架构提供了一个结合实时数据和Hadoop预先计算的数据环境的混合平台,以提供一个实时的数据视图、
层次结构:批处理层、实时处理层、服务层。
批处理层涉及的技术:flume采集数据,sqoop数据同步到结构化数据库中等,分布式存储(HDFS:基于文件的分布式存储系统,Hbase:结构化存储系统(Hadoop Database)nosql型数据库),分布式计算(mapreduce,spark),产生视图,数据序列化,视图存储数据库(Hbase,Impala,Redis/memcache,Mysql)。
实时处理层涉及的技术:flume,kafka,storm,spark Streaming
lambda架构:实现1