给大家推荐一本比较系统的Hadoop大数据书籍,方便大家快速入门
图书简介:
本书以Hadoop及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解了VMware中CentOS 7操作系统的安装;第2章讲解了大数据开发之前对操作系统集群环境的配置;第3~16章讲解了Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过实际案例加深对各个框架的理解与应用。通过阅读本书,读者即使没有任何大数据基础,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。
本书适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘的从业者阅读,也可作为培训机构与高校相关专业的教学参考书。
作者简介:
张伟洋:
资深大数据及Java工程师,先后就职于互联网公司百度、慧聪网等,任高级Java软件工程师及技术经理。现就职于英谷教育科技股份有限公司,任大数据项目讲师,曾多次为高等院校举行大数据专题讲座,对Hadoop及周边大数据框架等有深入研究。百度文库、百度阅读签约作者,高校教材《云计算与大数据概论》主要作者。
购书网站:当当,京东,天猫均已上架,需要的自行搜索购买。
前 言
当今互联网已进入大数据时代,大数据技术已广泛应用于金融、医疗、教育、电信、政府等领域。各行各业每天都在产生大量的数据,数据计量单位已从B、KB、MB、GB、TB发展到PB、EB、ZB、YB甚至BB、NB、DB。预计未来几年,全球数据将呈爆炸式增长。谷歌、阿里巴巴、百度、京东等互联网公司都急需掌握大数据技术的人才,而大数据相关人才却出现了供不应求的状况。已经为大家精心准备了大数据的系统学习资料,从Linux-Hadoop-spark-......,需要的小伙伴可以点击
Hadoop作为大数据生态系统中的核心框架,专为离线和大规模数据处理而设计。