背景,最近公司在用CDAP进行大数据开发,可是发现国内没有任何文档或者教程,所以写个这个专题,也许可以帮到一些刚入门大数据却又不知道怎么入门的人。
简单介绍,CDAP是Cask公司开发的基于现有hadoop已经相关技术(hive,hbase)的大数据集成系统(JAVA编写的)。想看英文的如下喽。
CDAP is an open source framework to build and deploy data applications on Apache™ Hadoop®. CDAP is an abstraction layer on top of Hadoop and other open source infrastructure such as HBase, Hive, Tephra, and Tigon