文章目录
本文档主要讲述如何在Cloudera Manager 管理的集群中安装StreamSets和基本使用。
1.安装前的准备
1.1 下载Streamsets Data Collector
到StreamSets官网提供的下载址:https://archives.streamsets.com/index.html 下载以下文件:这里下载使用的是 3.14.0版本
共有以下四个文件
1.2 配置 parcel.sha文件
STREAMSETS_DATACOLLECTOR-3.22.3-el7.parcel.sha中的内容要和manifest.json中CDH版本一致
打开manifest.json文件,此文件时json格式,在其中找到parcelName为"STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel"对应的hash值
将此hash拷贝到STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel.sha文件中
1.3 上传 parcel以及csd文件
将STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel.sha,STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel二个文件上传到cloudera-scm-server所在节点的**/opt/cloudera/parcel-repo目录下
上传STREAMSETS-3.14.0.jar到cloudera-scm-server所在节点的/opt/cloudera/csd**目录下,并赋予权限
chown cloudera-scm:cloudera-scm STREAMSETS-3.14.0.jar
chmod 644 STREAMSETS-3.14.0.jar
1.4 重启 cloudera-scm-server
systemctl restart cloudera-scm-server
2 开始安装
2.1登录 Cloudera Manager
点击导航栏【主机】–【Parcel】进入Parcel管理页面
会发现并不能看到上传的Streamsets的parcel,这是因为cdh默认刷新parcel是一小时一次。
点击“配置”,将Parcel更新频率改为1分钟
1分钟后重新刷新页面就可以看到刚刚上传的Streamsets的parcel
2.2分发并激活Parcel
点击“分配” 开始分发parcel
点击“分配” 开始分发parcel
点击“激活”,开始激活parcel
2.3 安装StreamSets Data Collector
选择集群名称右边的下拉框,选中【添加服务】
此时可以看到 新安装的Streamsets服务
选择将要安装到的节点
设置Streamsets的安装目录
开始安装
看到这个页面就代表安装成功了
回到Cloudera Manager首页,点击“Streamsets·”服务,进入Streamsets管理页面
点击【Web UI】选择下拉出的【Data Collector Web UI】链接就可以进入Streamsets的登录页面了
附:StreamSets 官方示例视频链接:
StreamSets Videos
StreamSets Product Explainers
StreamSets Snacks
StreamSets for Snowflake
StreamSets for Databricks
StreamSets for Azure
StreamSets for AWS
StreamSets Academy
StreamSets Data Collector Engine
StreamSets Control Hub