文章目录
本文档主要讲述如何在Cloudera Manager 管理的集群中安装StreamSets和基本使用。
1.安装前的准备
1.1 下载Streamsets Data Collector
到StreamSets官网提供的下载址:https://archives.streamsets.com/index.html 下载以下文件:这里下载使用的是 3.14.0版本
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保失败,源站可能有防盗链机制,建议将图片保存下来直接上传存上传(imXBrpAF2g0m-1646986875623)(assets/net-img-47acd071154ce78ca8b5f7665ae711-20220311141039-yczpbtx.png04 (assets/net-img-47acd07115c94ce781a8b5f7665ae719-20220311141004-yczpbtx.png)]](https://i-blog.csdnimg.cn/blog_migrate/d21447d31ee2b00064143fe2ab3b041d.png)
共有以下四个文件
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mOJVwQs4-1646986875625)(assets/net-img-1afef6793b0e45e69f6f930b26eeb0e2-20220311141004-lkokl1o.png)]](https://i-blog.csdnimg.cn/blog_migrate/22ae82a2de588d6376dc5bad3207cdda.png)
1.2 配置 parcel.sha文件
STREAMSETS_DATACOLLECTOR-3.22.3-el7.parcel.sha中的内容要和manifest.json中CDH版本一致
打开manifest.json文件,此文件时json格式,在其中找到parcelName为"STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel"对应的hash值
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1WJWhEnw-1646986875626)(assets/image-20220311154653-ie09c3u.png)]](https://i-blog.csdnimg.cn/blog_migrate/b5d0da62f4c54692d6b9247e1f8d9608.png)
将此hash拷贝到STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel.sha文件中
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yKaky0fc-1646986875628)(assets/image-20220311154919-tptaf48.png)]](https://i-blog.csdnimg.cn/blog_migrate/419a73f5b6999a1c5aff50ab482d601a.png)
1.3 上传 parcel以及csd文件
将STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel.sha,STREAMSETS_DATACOLLECTOR-3.14.0-el7.parcel二个文件上传到cloudera-scm-server所在节点的**/opt/cloudera/parcel-repo目录下
上传STREAMSETS-3.14.0.jar到cloudera-scm-server所在节点的/opt/cloudera/csd**目录下,并赋予权限
chown cloudera-scm:cloudera-scm STREAMSETS-3.14.0.jar
chmod 644 STREAMSETS-3.14.0.jar

1.4 重启 cloudera-scm-server
systemctl restart cloudera-scm-server
2 开始安装
2.1登录 Cloudera Manager
点击导航栏【主机】–【Parcel】进入Parcel管理页面

会发现并不能看到上传的Streamsets的parcel,这是因为cdh默认刷新parcel是一小时一次。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oN9PkJUa-1646986875635)(assets/Pasted image 20220301101208-20220308094101-phme26p.png)]](https://i-blog.csdnimg.cn/blog_migrate/b721c0010058e14d9fe22231b159b0b7.png)
点击“配置”,将Parcel更新频率改为1分钟
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-L521jxOX-1646986875637)(assets/Pasted image 20220301100809-20220308094114-z778s06.png)]](https://i-blog.csdnimg.cn/blog_migrate/abdda2bab03d372fee84f8a84063598d.png)
1分钟后重新刷新页面就可以看到刚刚上传的Streamsets的parcel
2.2分发并激活Parcel
点击“分配” 开始分发parcel
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DCK7EC0T-1646986875640)(assets/Pasted image 20220301101636-20220308094127-knyemq9.png)]](https://i-blog.csdnimg.cn/blog_migrate/564ab61a2d20b3895c4f1977edfefb1c.png)
点击“分配” 开始分发parcel
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fHLH2gPd-1646986875642)(assets/Pasted image 20220301101744-20220308094204-7xzgnbb.png)]](https://i-blog.csdnimg.cn/blog_migrate/1b1047549881cf4e8f930e9ae3767154.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Sa1vdAHB-1646986875643)(assets/Pasted image 20220301102147-20220308094245-iaef4o2.png)]](https://i-blog.csdnimg.cn/blog_migrate/881c596f5e22b40a17daae2831731ccd.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rc3IMZOS-1646986875644)(assets/Pasted image 20220302094549-20220308094254-k6js8o1.png)]](https://i-blog.csdnimg.cn/blog_migrate/51030879adbadad71bdb1e722af16172.png)
点击“激活”,开始激活parcel
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YDel8Trf-1646986875645)(assets/Pasted image 20220302094629-20220308094302-lc0dabw.png)]](https://i-blog.csdnimg.cn/blog_migrate/fc851fab570eaee1f2024d95620bebd6.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uDb5Abvj-1646986875646)(assets/Pasted image 20220302094706-20220308094311-lvt6shl.png)]](https://i-blog.csdnimg.cn/blog_migrate/e45f542e77878bed2c21863c6a855c0c.png)
2.3 安装StreamSets Data Collector
选择集群名称右边的下拉框,选中【添加服务】
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y78Ss7XM-1646986875647)(assets/Pasted image 20220302095103-20220308094318-hz4mlzr.png)]](https://i-blog.csdnimg.cn/blog_migrate/850d02cb8bcf8195b23cfd1bf00d5033.png)
此时可以看到 新安装的Streamsets服务
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Zy6aptJb-1646986875649)(assets/Pasted image 20220303133914-20220308094445-uvt2u76.png)]](https://i-blog.csdnimg.cn/blog_migrate/1dbec1ffaa7541e8be6e4287b40c6b1d.png)
选择将要安装到的节点
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EskiJbA1-1646986875650)(assets/Pasted image 20220303133824-20220308094439-z20glcx.png)]](https://i-blog.csdnimg.cn/blog_migrate/8e4719b83f20a025bf984661f73acc6a.png)
设置Streamsets的安装目录
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4Nl3pnfl-1646986875651)(assets/Pasted image 20220303133949-20220308094421-lijczze.png)]](https://i-blog.csdnimg.cn/blog_migrate/c84424a23e3da7db3f4b888b3a8aea28.png)
开始安装
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-khFr3H9P-1646986875652)(assets/Pasted image 20220303134137-20220308094415-rkj3y69.png)]](https://i-blog.csdnimg.cn/blog_migrate/8a59490ce970768ff5f8c2c2de5dda9e.png)
看到这个页面就代表安装成功了
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ocHVKoJP-1646986875654)(assets/Pasted image 20220303134202-20220308094407-z3ptq18.png)]](https://i-blog.csdnimg.cn/blog_migrate/9cd31f4e8400b93d001511ab3e5b4e7d.png)
回到Cloudera Manager首页,点击“Streamsets·”服务,进入Streamsets管理页面


点击【Web UI】选择下拉出的【Data Collector Web UI】链接就可以进入Streamsets的登录页面了
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-onf8LtN6-1646986875660)(assets/Pasted image 20220303134754-20220308094346-5zybcid.png)]](https://i-blog.csdnimg.cn/blog_migrate/75d2e7506cac7d6d2e31da2239344e42.png)
附:StreamSets 官方示例视频链接:
StreamSets Videos
StreamSets Product Explainers
StreamSets Snacks
StreamSets for Snowflake
StreamSets for Databricks
StreamSets for Azure
StreamSets for AWS
StreamSets Academy
StreamSets Data Collector Engine
StreamSets Control Hub
本文详细介绍了如何在Cloudera Manager管理的CDH6.3.2集群上通过Parcel方式安装Streamsets Data Collector 3.14.0,包括下载Parcel文件、配置SHA文件、上传并激活Parcel,以及通过Cloudera Manager添加和安装服务。
301

被折叠的 条评论
为什么被折叠?



