大数据之数据仓库

大家好,我是曜耀,

今天来说说大数据的基层:数据仓库。

对于我们大数据的来说,数据仓库不是给我们看得,而是给我们的上司看得,不仅仅是上司还有我们的客户,对于他们来说,数据仓库承载着整个企业的全业务的数据。早期数仓在关系型数据如Oracle,MySql上。到大数据时代,基于hadoop生态的大数据架构,数仓基本上都是基于hive的数仓。对于很多大数据开发者而言,特别是早期,很多开发者认为hive数仓就是和业务相关,隐射Hdfs数据文件的一张张表。针对于hive数仓而言,最终看到的确实是一张纸表,但这些表是如何根据业务抽象出来的、表之间的关系、表如何更好的服务应用这些问题是数仓建模、数仓技术架构的核心。一个好的数仓技术架构和数仓建模。可以减少开发的难度,提高数据服务性能,同时能够在很大层面上对业务形成数据中心,降低存储,计算资源。

不过记住只有那些打的公司需要数据仓库,因为这是公司从小公司一步一步成长到大的公司,其中积累了很多的珍贵的 数据,小公司就不由这个必要了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值