【SDC】CDH6.3.2中通过parcel安装Streamsets Data Collector 3.14.0

本文详细介绍了如何在Cloudera Manager管理的CDH6.3.2集群上通过Parcel方式安装Streamsets Data Collector 3.14.0,包括下载Parcel文件、配置SHA文件、上传并激活Parcel,以及通过Cloudera Manager添加和安装服务。
摘要由CSDN通过智能技术生成

本文档主要讲述如何在Cloudera Manager 管理的集群中安装StreamSets和基本使用。

1.安装前的准备

1.1 下载Streamsets Data Collector

到StreamSets官网提供的下载址:https://archives.streamsets.com/index.html 下载以下文件:这里下载使用的是 3.14.0版本
[外链图片转存失败,源站可能有防盗​链机制,建议将图片保失败,源站可能有防盗链机制,建议将图片保存下来直接上传存上传(imXBrpAF2g0m-1646986875623)(assets/net-img-47acd071154ce78ca8b5f7665ae711-20220311141039-yczpbtx.png04  (assets/net-img-47acd07115c94ce781a8b5f7665ae719-20220311141004-yczpbtx.png)]

共有以下四个文件
​[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mOJVwQs4-1646986875625)(assets/net-img-1afef6793b0e45e69f6f930b26eeb0e2-20220311141004-lkokl1o.png)]

1.2 配置 parcel.sha文件

STREAMSETS_DATACOLLECTOR-3.22.3-el7.parcel.sha中的内容要和manifest.json中CDH版本一致

打开manifest.json文件,此文件时json格式,在其中找到parcelName为"STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel"对应的hash值
​[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1WJWhEnw-1646986875626)(assets/image-20220311154653-ie09c3u.png)]

将此hash拷贝到STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel.sha文件中
​[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yKaky0fc-1646986875628)(assets/image-20220311154919-tptaf48.png)]

1.3 上传 parcel以及csd文件

STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel.sha,STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel二个文件上传到cloudera-scm-server所在节点的**/opt/cloudera/parcel-repo目录下
​[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8swuvJpu-1646986875630)(assets/image-20220311155200-x4ltvbu.png)]上传
STREAMSETS-3.14.0.jarcloudera-scm-server所在节点的/opt/cloudera/csd**目录下,并赋予权限

chown cloudera-scm:cloudera-scm STREAMSETS-3.14.0.jar
chmod 644  STREAMSETS-3.14.0.jar

在这里插入图片描述

1.4 重启 cloudera-scm-server
systemctl restart cloudera-scm-server

2 开始安装

2.1登录 Cloudera Manager

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EI04Nei8-1646986875633)(assets/Pasted image 20220301100131-20220308094008-5tp99tr.png)]点击导航栏【主机】–【Parcel】进入Parcel管理页面
在这里插入图片描述

会发现并不能看到上传的Streamsets的parcel,这是因为cdh默认刷新parcel是一小时一次。
​[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oN9PkJUa-1646986875635)(assets/Pasted image 20220301101208-20220308094101-phme26p.png)]
点击“配置”,将Parcel更新频率改为1分钟
​[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-L521jxOX-1646986875637)(assets/Pasted image 20220301100809-20220308094114-z778s06.png)]
1分钟后重新刷新页面就可以看到刚刚上传的Streamsets的parcel

2.2分发并激活Parcel

点击“分配” 开始分发parcel

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DCK7EC0T-1646986875640)(assets/Pasted image 20220301101636-20220308094127-knyemq9.png)]
点击“分配” 开始分发parcel

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fHLH2gPd-1646986875642)(assets/Pasted image 20220301101744-20220308094204-7xzgnbb.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Sa1vdAHB-1646986875643)(assets/Pasted image 20220301102147-20220308094245-iaef4o2.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rc3IMZOS-1646986875644)(assets/Pasted image 20220302094549-20220308094254-k6js8o1.png)]
点击“激活”,开始激活parcel

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YDel8Trf-1646986875645)(assets/Pasted image 20220302094629-20220308094302-lc0dabw.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uDb5Abvj-1646986875646)(assets/Pasted image 20220302094706-20220308094311-lvt6shl.png)]

2.3 安装StreamSets Data Collector

选择集群名称右边的下拉框,选中【添加服务】

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y78Ss7XM-1646986875647)(assets/Pasted image 20220302095103-20220308094318-hz4mlzr.png)]

此时可以看到 新安装的Streamsets服务

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Zy6aptJb-1646986875649)(assets/Pasted image 20220303133914-20220308094445-uvt2u76.png)]

选择将要安装到的节点

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EskiJbA1-1646986875650)(assets/Pasted image 20220303133824-20220308094439-z20glcx.png)]

设置Streamsets的安装目录

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4Nl3pnfl-1646986875651)(assets/Pasted image 20220303133949-20220308094421-lijczze.png)]

开始安装

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-khFr3H9P-1646986875652)(assets/Pasted image 20220303134137-20220308094415-rkj3y69.png)]

看到这个页面就代表安装成功了

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ocHVKoJP-1646986875654)(assets/Pasted image 20220303134202-20220308094407-z3ptq18.png)]

回到Cloudera Manager首页,点击“Streamsets·”服务,进入Streamsets管理页面
在这里插入图片描述在这里插入图片描述

点击【Web UI】选择下拉出的【Data Collector Web UI】链接就可以进入Streamsets的登录页面了

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-onf8LtN6-1646986875660)(assets/Pasted image 20220303134754-20220308094346-5zybcid.png)]


附:StreamSets 官方示例视频链接:
StreamSets Videos
StreamSets Product Explainers
StreamSets Snacks
StreamSets for Snowflake
StreamSets for Databricks
StreamSets for Azure
StreamSets for AWS
StreamSets Academy
StreamSets Data Collector Engine
StreamSets Control Hub

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值