数据架构简析
简单了解大数据Hadoop最初指代的是分布式文件系统HDFS和Mapreduce计算框架,但是它一路高歌猛进,在此基础之上像搭积木一般快速发展成为一个庞大的生态(包括Yarn,Hive,HBase,Spark等十种之多)为解决海量数据下分析查询性能问题,数据仓库的基础上衍生出的概念1、对数据仓库进行分层,通过层层递进形成数据集市,减少最终查询的数据体量2、提出数据立方体的概念,通过对数据预先处理,以时间换空间,提升查询性能。BI系统在Hadoop技术的加持下,在海量数据下要实现多维分析的实时应答,
原创
2022-01-29 11:30:45 ·
3111 阅读 ·
0 评论