---- 文章中出现任何问题或描述不清楚的地方请不吝指出,大家共同交流,一起进步!----
今天给大家推进一些自己看过的大数据领域的经典书籍,我将从整体架构到具体细分领域这样的模式给大家进行推荐。
(一) 整体架构
0. 《Hadoop权威指南:大数据的存储与分析》(第4版) Tom White 著
1. 《大数据之路:阿里巴巴大数据实践》 阿里巴巴数据技术及产品部 著
2. 《大数据技术体系详解:原理、架构与实践》 董西成 著
4. 《数据中台:让数据用起来》付登坡 江敏 任寅姿 孙少忆 等著
5. 《Designing Data-Intensive Applications》 Martin Kleppmann 著
6. 《分布式系统:概念与设计》George Coulouris/Jean Dollimore/Tim Kindberg/Gordon Blair著
(二) 数据采集
2. 《Kafka The Definitive Guide》Neha Narkhede/Gwen Shapira/Todd Palino 著
(三) 计算引擎
1.《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》董西成 著
2.《Learning Spark》 2nd Edition Tathagata Das/Jules Damji/Brooke Wenig/Denny Lee 著
3. 《Stream Processing with Apache Flink: Fundamentals, Implementation, and Operation of Streaming Applications》 Fabian Hueske/Vasiliki Kalavri 著
(四) 存储系统
1.《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》蔡斌/陈湘萍 著
2.《HBase原理与实践》胡争/范欣欣 著
(五) OLAP引擎
1. 《Apache Kylin权威指南》Apache Kylin核心团队 著
(六) 数据分析
-
《Hive性能调优实战》林志煌 著
2. 《Hadoop构建数据仓库实践》王雪迎 著
3. 《数据仓库 》W. H. Inmon著
4. 《数据仓库工具箱》(第3版)Ralph Kimball/Margy Ross 著
5. 《Star Schema完全参考手册》Christopher Adamson 著
6. 《大数据分析的道与术》 毕然 著
(七) 大数据应用
3. 《数据驱动:从方法到实践》桑文锋 著
(八) 监控运维
1.《SRE:Google 运维解密》Betsy Beyer等 著
2. 《SRE生存指南:系统中断响应与正常运行时间最大化》 Nat Welch 著
3. 《Prometheus技术秘笈》百里燊 著
4. 《Zabbix企业级分布式监控系统》(第2版)吴兆松 著
(九) 数据治理
1.《DAMA数据管理知识体系指南》(原书第2版)数据管理协会(DAMA国际) 著
2. 《主数据驱动的数据治理:原理、技术与实践》 王兆君/王钺/曹朝辉 著
(十) 小结
从我推荐的书籍中我们可以发现国内和国际大厂在大数据应用方面有着很深的技术积累,我们学习大数据技术主要是与一线大厂看齐,与一线大厂推广的最新技术保持同步,借助着优秀的开源产品和开源社区助力我们运用好大数据技术,使大数据技术发挥价值。
最后,借推荐书籍到机会顺便整理了下自己到知识体系,发现自己从一开始从事大数据开发更多到进行应用层面的开发,到现在逐步的往底层发展了。最近都在做系统运维及架构方面的工作了,期望自己能够基于自己多年的应用开发经验把大数据系统运用好,更好到服务于各项业务,加油!