自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 centos7下CM6.3.1+CDH6.3.2安装部署

Centos7.3 下CM6.3.1 CDH6.3.2离线安装集群规划hostnamecdh1cdh2cdh3cdh4IP192.168.147.201192.168.147.202192.168.147.203192.168.147.204内存4g6g3g3g磁盘50g50g50g50gcpu2 core2 core2 core2 coreCMserveragentagentagentntpserver

2020-06-21 16:49:46 6642 10

原创 解决 hue,impala操作kudu表时候报错,删除不了表也创建不了CAUSED BY: NoLeaderFoundException: Master config

问题8:操作kudu表maininfo 时候,不论增删改查都会报错。删除不了表,也建不了表Java连接impala jdbc操作该表报错如下(hue,impala同理):java.sql.SQLException: [Cloudera][ImpalaJDBCDriver](500051) ERROR processing query/statement. Error Code: 0, SQL state: TStatus(statusCode:ERROR_STATUS, sqlState:HY000,

2021-07-16 14:39:09 1122

原创 kafka tool 2.1连接kerberos的kafka(cdh6.3.2)集群。

kafka tool 2.1连接kerberos的kafka(cdh6.3.2)集群。kafka tools 下载连接:https://www.kafkatool.com/download.html当cdh开启kerberos 后,kafka的监控工具就很难配置了,kafkatool 我也是配置了很久。偶然间配置成功了。kafka tools从2.1开始改名为offsetexplorer 。暂时不影响使用。kafka是cdh6.3.2版本的。已经开启sasl_PLAINTEXT.kafka tool

2021-03-31 10:06:59 6434 10

原创 MANUAL_FLUSH is enabled but the buffer is too big

环境:cdh6.3.2环境下,spark on yarn,client/cluster模式运行报错:sparkStreaming 消费kafka数据到kudu中报错如下:每批数据大概4000条21/03/12 10:13:24 ERROR executor.Executor: Exception in task 1.1 in stage 0.0 (TID 4)org.apache.kudu.client.NonRecoverableException: MANUAL_FLUSH is enabled

2021-03-13 16:25:08 695

原创 CDH6生产环境centos7系统配置优化

一. 部署前 linux优化:个人笔记1.1 预读缓冲​ 预读技术可以有效的减少磁盘寻道次数和应用的I/O等待时间,增加Linux文件系统预读缓冲区的大小(默认为256 sectors,128KB),可以明显提高顺序文件的读性能,建议调整到1024或2048 sectors。节约时间直接进行修改操作://针对每个服务器的数据磁盘,修改预读缓冲为2048或者1024[root@master001 ~]# df -Th //查看磁盘部署情况[root@master001 ~]# bloc

2020-11-05 15:45:07 504

原创 CDH6 配置LDAP,Kerberos,Sentry

CDH6 配置LDAP,Kerberos,Sentry1. 开启Sentry 控制Hive,Hue,Impala权限1.1 在mysql中配置数据库[root@cdh1 ~]# mysql -uroot -p //登陆mysqlmysql> CREATE DATABASE sentry DEFAULT CHARACTER SET utf8; //创建sentry库mysql> grant all on sentry.* to 'sentry'@'%' identified

2020-10-14 18:05:15 2406 2

原创 Livy0.7.0 提交sparkStreaming 任务

Livy0.7.0 提交sparkStreaming 任务livy提交spark方式:Livy是一个基于Spark的开源REST服务,它能够通过REST的方式将代码片段或是序列化的二进制代码提交到Spark集群中去执行。livy 将每一个启动的spark任务称之为session,Session是通过RPC协议在spark集群和livy服务端进行通信。根据处理方式不同分为两种Session类型:(1)交互式会话,这与Spark中的交互式处理相同 如spark shell,交互式会话在其启动后可以接收用

2020-09-14 10:55:46 777

原创 kudu建表多ranges paritiiton 分区shell脚本

kudu建表多ranges paritiiton 分区shell脚本需求:创建kudu表时候要求以每天作为一个range分区。这样如果建立几年的table会很麻烦。下面的脚本实现两个功能:1.创建指定年份区间的range 分区表2.增加range 分区的shell 脚本目前给出如下三个脚本,其他的record_*.sh 脚本都是sql脚本,仿照record_1.sh实现即可。1.createtable.sh运行示例:./createtable.sh cdh2:7051 impala_kud

2020-08-31 23:22:16 1494 1

原创 cdh-kafka 双网卡双IP下,别人无法连接kafka

基于CDH6.2的Kafka集群外网访问配置个人电脑CDH集群 下安装kafka服务,同事之前想使用我的kafka,但是我们是wifi连的网络,所以我配置的linux环境为双网卡模式,也就是每个虚机双ip。net 模式ip为固定ip(192.168.147.204),桥接模式ip dhcp动态ip(192.168.1.123)问题:其他同事使用动态ip 192.168.1.123 链接不到我的kafka环境。解决:通过修改kafka配置:配置- 高级listeners=PLAINTEXT://0

2020-08-21 18:50:57 1139

原创 CM6.3.X 部署Flink1.9.0服务

CM6.3.X 部署Flink1.9.0服务1.下载Flink包下载方式1,官网下载parcel,manifest,csa 包及文件。https://archive.cloudera.com/csa/1.0.0.0/parcels/https://archive.cloudera.com/csa/1.0.0.0/csd/下载方式2:提供百度网盘下载地址,内含上面三个包。官网下载比较慢 预计3小时百度网盘:https://pan.baidu.com/s/1DVG8z77wGOohQSamerq

2020-07-09 10:15:40 803 1

原创 Apache Griffin-0.5.0 数据质量监控工具安装及运行batch,streaming数据质量监测demo

Apache Griffin 数据质量监控工具官网:http://griffin.apache.org/docs/quickstart-cn.htmlgithub:参考:https://cwiki.apache.org/confluence/display/GRIFFIN/1.+Overview测试流数据:http://griffin.apache.org/data/streaming/测试批数据:http://griffin.apache.org/data/streaming/一. 概述数据

2020-07-08 00:12:35 3590 7

原创 centos7下制作livy0.7.0的parcel包和csd文件

制作livy的parcel包和csd文件Livy是一个基于Spark的开源REST服务,它能够通过REST的方式将代码片段或是序列化的二进制代码提交到Spark集群中去执行。Cloudera Manager 添加livy服务需要制作parcel包及csd文件。最新版本为0.7.0,github上3年没更新了我的环境为CDH6.3.2,CM6.3.1平台。官网:http://livy.incubator.apache.org/,配置java,maven等环境 (略)下载cm_ext工具。可

2020-06-29 10:36:22 515

原创 10步完成centos7 下 Cloudera Manager 6.X cdh 添加 ElasticSearch7.8.0(ES) 服务

centos7 Cloudera Manager 6.X 添加 ES 服务基础环境为CM6.3.1 和CDH6.3.2平台。centos7.详细搭建看上一篇。ES下载地址:https://www.elastic.co/cn/downloads/past-releases#elasticsearch百度网盘下载方式:https://pan.baidu.com/s/1CY0sitxJEbOqttsSNBGt0A 提取码:xcdnCM 中添加Elasticserch 服务,嫌麻烦的可以查下其他的简单安

2020-06-25 00:50:59 1765 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除