大数据应用统一集成平台CDAP简介

CDAP是一个开源的大数据应用平台,提供统一的数据处理、应用开发和管理功能。它支持实时、批量和SQL访问数据,具备ETL、事务处理、运行可移植性等特性。CDAP的组件包括Datasets、Programs、Services和Tools,适用于日志分析、时间序列数据处理等多种场景。然而,CDAP的社区活跃度较低,且不支持Spark,建议在选择时谨慎考虑。
摘要由CSDN通过智能技术生成

CDAP概述

      CDAP (CAST DATA APPLICATION PLATFORM)是一个开源的大数据应用统一集平台,帮助应用开发者和系统管理员基于Hadoop技术栈来构建、测试、部署、管理数据应用程序。CDAP由Datasets、Programs、 Services、Tools等组件组成,如图1 所示:

这里写图片描述

      其中:
      CDAP Datasets:是存储在HDFS和HBase中数据的逻辑表示,Datasets提供从应用中写数据的接口层,不关心底层存储引擎,允许以重用库的方式封装应用数据。

      CDAP Programs:应用程序可使用不同的开源框架如MapReduce、Spark和realtime Flow来处理,CDAP附带App container来整合每个处理框架,并提供一种标准化的方式来开发、部署和管理程序。

       CDAP Services:系统级服务,在开发和生产环境中支持数据和应用程序,包括应用管理,元数据管理,数据流和安全。

       CDAP Tools: 包括开发工具如:Maven、SDK、调试工具、测试框架和操作界面(UI)。

       CDAP支持多种运行环境,基于内存、单机和集群,CDAP子项目提供和CDAP交互的SDK和工具、applications和可重用的大数据组件(packs)

这里写图片描述

CDAP的特性

       数据提取
       通过流的方式提供了可扩展、可靠的实时和批量数据提取,支持push和pull,支持Flume, Kafka 和 REST,支持SQL-like 数据查询,如下图所示。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值