大家好,我是曜耀,
今天来说说大数据的基层:数据仓库。
对于我们大数据的来说,数据仓库不是给我们看得,而是给我们的上司看得,不仅仅是上司还有我们的客户,对于他们来说,数据仓库承载着整个企业的全业务的数据。早期数仓在关系型数据如Oracle,MySql上。到大数据时代,基于hadoop生态的大数据架构,数仓基本上都是基于hive的数仓。对于很多大数据开发者而言,特别是早期,很多开发者认为hive数仓就是和业务相关,隐射Hdfs数据文件的一张张表。针对于hive数仓而言,最终看到的确实是一张纸表,但这些表是如何根据业务抽象出来的、表之间的关系、表如何更好的服务应用这些问题是数仓建模、数仓技术架构的核心。一个好的数仓技术架构和数仓建模。可以减少开发的难度,提高数据服务性能,同时能够在很大层面上对业务形成数据中心,降低存储,计算资源。
不过记住只有那些打的公司需要数据仓库,因为这是公司从小公司一步一步成长到大的公司,其中积累了很多的珍贵的 数据,小公司就不由这个必要了。