1.关于StreamSets
StreamSets由Informatica前首席产品官Girish Pancha和Cloudera前开发团队负责人Arvind Prabhakar于2014年创立。他们成立该公司主要是应对来自动态数据(data in motion)的挑战 - 包括数据源,数据处理和数据本身,这是一个称为“数据漂移“(https://streamsets.com/reports/data-drift/)的问题。StreamSets设想从头开始管理数据流,避免已有产品和工具的缺陷,并启用一种管理动态数据(data in motion)的新方法。
他们的第一款产品StreamSets Data Collector(https://streamsets.com/products/sdc)被数百家公司用于构建复杂的任意数据流,其中包括财富500强企业,涵盖金融服务,制造业,医疗,媒体,制药和技术等多个行业。
他们最新的产品StreamSets Dataflow Performance Manager,也叫DPM,主要用于构
本文档详细介绍了如何在Cloudera Manager管理的CDH集群中安装和使用StreamSets,包括配置Parcel包、CSD,以及创建和配置数据管道进行数据处理和预览。
订阅专栏 解锁全文
577

被折叠的 条评论
为什么被折叠?



