Streamsets 介绍

StreamSet 介绍

Streamsets是一款大数据实时采集和ETL工具,可以实现不写一行代码完成数据的采集和流转。通过拖拽式的可视化界面,实现数据管道(Pipelines)的设计和定时任务调度。
最大的特点有:

  1. 可视化界面操作,可以直观排查错误;
  2. 内置监控,可是实时查看数据流传输的基本信息和数据的质量;
  3. 强大的整合力,对现有常用组件全力支持。

对于Streamsets来说,最重要的概念就是数据源(Origins)、操作(Processors)、目的地(Destinations)、执行器(Executor)。
具体的介绍,请参考:https://streamsets.com/documentation/datacollector/3.9.x/help/index.html
官方论坛:https://ask.streamsets.com/questions/

StreamSet 安装

streamset安装有多种方式,

1. Docker 安装

docker 镜像发布安装,步骤简单很多

docker pull streamsets/datacollector
docker run --restart on-failure -p 18630:18630 -d --name streamsets-dc streamsets/datacollector dc

2. RPM 安装

1、下载安装包
下载链接:https://streamsets.com/products/dataops-platform/open-source/
目前官方下载需要注册,简单注册一下好了。
在这里插入图片描述
这家伙足足有5个多GB,下载前请准备好充足的磁盘空间

2、安装
安装前准备:安装jdk
系统环境:centos7

# 下载解压
[root@localhost ~]# wget https://s3-us-west-2.amazonaws.com/archives.streamsets.com/datacollector/3.18.1/rpm/el7/activation/streamsets-datacollector-3.18.1-el7-activation-all-rpms.tar
[root@localhost ~]# tar xf streamsets-datacollector-3.18.1-el7-activation-all-rpms.tar
[root@localhost ~]# cd streamsets-datacollector-3.18.1-el7-activation-all-rpms
# 安装
[root@localhost ~]# yum localinstall streamsets*.rpm -y 

3、启动
我们先不改Streamsts参数,直接启动

[root@localhost ~]# systemctl start sdc
[root@localhost ~]# ps -ef|grep sdc
[root@localhost ~]# systemctl status sdc
[root@localhost ~]# systemctl enable sdc
[root@localhost ~]# systemctl status sdc

4、登录
Streamsets默认端口号:18630
所以访问链接为:http://host:18630
密码:admin/admin
在这里插入图片描述
在这里插入图片描述
实时数据同步管道,我们现在主要是将RDS中的数据同步到ES中。以项目为单位创建管道(一个项目一个管道)后续我将详细介绍实时宽表的思路、实现过程
在这里插入图片描述

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
StreamSets是一款开源的数据流管道解决方案,适用于实时数据处理和ETL(Extract, Transform, Load)任务。它提供了一个可视化界面,使用户能够轻松地创建、管理和监控数据流管道。 StreamSets具有很多功能和优势。首先,它支持各种数据来源和目标,包括关系数据库、文件系统、消息队列等等,使用户能够方便地从各种数据源中获取数据并将其发送到目标位置。 其次,StreamSets提供了强大的数据转换和处理功能。用户可以使用内置的转换器和处理器来执行各种操作,如数据清洗、格式转换、过滤等等。此外,StreamSets还支持自定义转换器和处理器,以满足用户的特定需求。 另外,StreamSets具有很强的实时性能。它能够以非常低的延迟处理大量的数据,并且支持容错和高可用性,确保数据流管道的稳定和可靠性。 在使用StreamSets时,用户可以通过可视化界面轻松地创建和配置数据流管道。它提供了丰富的图形化组件和工具,使用户能够直观地理解和管理数据流。此外,StreamSets还提供了实时的监控和报警功能,用户可以随时了解管道的状态和性能。 总而言之,StreamSets是一款功能强大且易于使用的数据流管道解决方案。它能够帮助用户处理实时数据并实现ETL任务,提高数据处理的效率和可靠性。无论是在大数据领域还是传统数据处理领域,StreamSets都是一个值得考虑和尝试的工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

风清若淡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值