cdh6.2.1+flink1.9+druid1.8搭建实践

16 篇文章 4 订阅
15 篇文章 1 订阅

1、CDH版本调研和相应依赖整理
综述
一般组件版本管理工具包含两种方式,第一种ambari 第二种为cloudra 两种各有优缺点,但立足公司实际情况,需要一种相对来说,比较稳定,并且易于管理监控更加方便,一般不用二次开发的集群。并且cloudera相对ambari市场占有率比较大解决方案相对比较成熟。因此决定采用cloudera manager 去监控管理公司的集群。
版本选择
Cloudera于2018年8月30日正式发布CDH6.0.0,CDH6是基于Hadoop3同时包含大量其他组件的大版本更新的发布版本,许多用户考虑到未来CDH的版本主要是基于CDH6,而CDH5会慢慢的停止更新并且cloudera 官宣几年之后将不在支持5,所以考虑新搭集群使用CDH6。第一个问题就是需要考虑CDH5和CDH6的差别,从各个方面详细比较CDH5和CDH6的差别,以下内容主要基于最新的CDH5最新版本和CDH6进行比较。

1、操作系统选择区别
在这里插入图片描述

2、底层数据库支持
在这里插入图片描述
3、jdk 不同版本支持情况
在这里插入图片描述

4、cdh 不同版本的支持的hadoop版本
在这里插入图片描述

参考:https://mp.weixin.qq.com/s?__biz=MzI4OTY3MTUyNg==&mid=2247495158&idx=1&sn=db40f26a2b939699c01760a662b4986d&chksm=ec293dffdb5eb4e9e1e0d782caeee73703ad29d1c8b6d2c89951e186420021eb629fb5bc5252&scene=21#wechat_redirect
参考:
https://mp.weixin.qq.com/s?__biz=MzI4OTY3MTUyNg==&mid=2247495280&idx=1&sn=e1d09b47cc18a2d6e862d21501b44475&chksm=ec293e79db5eb76f6267a8ac4309b920e291f2f5c792eb02a64feec6af72892d625fdf4c1085&scene=21#wechat_redirect
注意:在以前的集群的搭建过程种发现flink 对hadoop 3.0支持的版本不好,经过调研cdh6 已经提供了对flink编译安装的支持
参考:https://blog.csdn.net/kwame211/article/details/104690955
注意:druid在调研过程中没有网上没有出现和cdh集成出现的错误(暂时任务druid和cdh不会出现兼容情况)
暂定版本 cdh6.2.1(具体安装请参考字节的安装文档)

flink 版本安装参考采用: https://blog.csdn.net/kwame211/article/details/104690955

druid 安装参考: https://blog.csdn.net/wangshuminjava/article/details/81772695

注意过程中因为使用一下命令初始化版本依赖总是下载不下来。所以采用一种自己替换相关依赖包的问题

Hadoop集群版本必须和Druid.io中版本同一,可以通过pull-deps下载相同hadoop-dependencies版本,e.g. : 
java -classpath "lib/*" io.druid.cli.Main tools pull-deps --defaultVersion 0.9.1.1 -c io.druid.extensions:mysql-metadata-storage:0.9.1.1 -c druid-hdfs-storage -h org.apache.hadoop:hadoop-client:2.6.0
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CDH 6.2.1 是 Cloudera 公司提供的一个大数据处理平台。它包含了各种组件和工具,用于存储、处理和分析大规模的数据。 要安装CDH 6.2.1,首先需要下载安装包。可以从 Cloudera 的官方网站上获得安装包,或者从其他可靠的资源下载。安装包主要包括各个组件的二进制文件、配置文件和文档。 安装CDH 6.2.1之前,需要先安装操作系统和一些依赖软件,如Java等。确保操作系统和依赖软件的版本满足CDH 6.2.1的要求。然后,使用命令行或图形界面工具解压安装包到指定目录。 解压安装包后,需要对各个组件进行配置。可以根据实际需求,修改配置文件来调整组件的行为。配置文件通常保存在安装目录下的conf目录中。在配置文件中,可以设置各组件的参数,如数据存储路径、网络端口等。 配置完成后,可以启动CDH 6.2.1的各个组件。启动命令可以在安装包的文档中找到。启动后,可以通过浏览器访问CDH 6.2.1的管理界面,进行管理和监控。在管理界面中,可以查看集群的状态、添加和删除节点等。 如果需要使用CDH 6.2.1进行数据处理和分析,可以使用提供的工具和API。CDH 6.2.1支持各种数据处理框架,如Hadoop、Spark、Hive等。用户可以根据需要选择合适的工具和API,进行数据处理和分析。 总之,安装CDH 6.2.1需要下载安装包,解压到指定目录,进行配置,启动组件,然后使用工具和API进行数据处理和分析。在安装和使用过程中,可以参考官方文档和社区资源,获得帮助和支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值