数据仓库书籍推荐

数据仓库应具备的能力
(1)SQL
(2)建模理论
(3)业务知识
(4)大数据组件
(5)数据治理、数据分析、数据挖掘能力
SQL
这是数据仓库最基本的技能,工作中60%的时间都需要写SQL,由于天天写SQL,我们通常自嘲为SQL Boy,SQL一定要写的利索,毕竟将来大部分时间都是和这个打交道。当我们学习了SQL,后面我们遇到的Hive、Spark Stream、Flink Stream都是一样的东西,全是写SQL,不要怕!!
建模理论
说到数据仓库的建模理论,不得不提两位大神Bill Inmon、Kimball。Inmon提出了数据仓库是一个面向主题的、集成的、相对稳定的、反应历史变化的数据集合,用于支持管理决策(数据仓库的定位);Kimball提出数据仓库是一个将源系统数据抽取、清洗、规格化、提交到维度数据存储的系统,为决策的制定提供查询和分析功能的支持与实现(数据仓库操作方法),以上都不是重点,这两位大神写的书稍许晦涩难懂,这里推荐阿里巴巴的《大数据之路》,讲了阿里巴巴在大数据领域的建立,特别是数据模型的设计以及实现,工作中80%的问题都在这本书能找到答案,最贴近工作,最实践的书一定要看!!
如果对理论感兴趣的话,有精力可以看下两位数据仓库奠基人的书,《数据仓库工具箱》是Kimball大神写的,市面上很少在维度建模比它更具权威性,《数据仓库》是Inmon大神写的,理论性特别强,但是当你工作一段时间后再来看这本书,会受益匪浅。早期入门不建议看这两本书,等到有一定经验一定要读一读.
业务知识
各行各业的业务千奇百怪,但是万变不离其中,我们需要在海量的数据中提取出有用的数据。日常工作中数据仓库对接的比较多的数据分析师、数据产品、算法、运营等,他们都是靠近业务的,他们是如何思考数据以及挖掘数据深层次的价值,这里推荐《数据化运营》,是数据在企业经营和产品运营中的具体应用,通俗易懂的介绍了数据分析、指标体系、数据监测、数据智能、数据创新等。
大数据组件
数据仓库是一门半技术活,我们一半需要懂技术,一半需要懂业务。当你阅读完以上三本书籍,需要对底层的技术有些了解,这个时候需要去学习下大数据基本的组件(Hadoop、Hive、Spark、Flink、Kafka、Flume、Sqoop等等),每一个学习起来都是需要大量的时间,但是作为一名数据仓库工程师,我们需要学习吗?答案是需要的,但是我们仅仅需要了解一下大数据生态,知道各个组件是干嘛的,基本上怎么用即可,这里推荐一本《大数据日知录》,现在大部分的互联网公司的数据仓库都是基于这一套框架来的,这本书能对大数据生态有一个大概的认识
数据治理、数据分析、数据挖掘能力
这一部分目前没深入学习接触,待以后在推荐

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值