大数据之家-CSDN博客

原创 python手动安装最新版本

/configure -C --with-openssl=/usr/lib/openss3.0.13/ --with-openssl-rpath-auto --prefix=/usr/lib/python3.11.4 #编译。2、Python配置文件修改（Modules/Setup），否则无法使用pip install。这一步若报出'cannot find -lssl'错误，需要手动将openssl添加到环境变量。make -j8 && make install #安装。查看版本状态一致后完成安装。

2024-09-14 17:09:22 206 1

原创 zeppline如何配置用户登陆

1、打开文件，通常位于目录下。添加或修改以下属性以启用简单的用户名/密码身份验证：<property><property>

2024-09-02 22:13:01 353

原创 hive benchmark

hive-testbench-hdp3/tpcds-gen目录下，make，等执行完毕后，进入目录 “/hive-testbench-hdp3/tpcds-gen/target”，可以找到 “tpcds-gen-1.0-SNAPSHOT.jar”文件。2、unzip hdp3.zip（可以直接从git上下载zip包）1、下载benchmark程序。

2024-08-18 22:15:46 224

原创 Flink CDC (session模式)

2、配置变更(application在session起来后再调整，客户端配置)1、相关的CDC包需要移动到flink home。

2024-08-16 10:18:43 348

原创 Flink cdc正确打开方式（flink on yarn）

3、oracle驱动缺失, on yarn缺失的jar需要拷贝到#FLINK_HOME/lib/1、Flink on yarn模式下，flink cdc需要先启动yarn-session模式。2、启动之后进行正常测试。

2024-08-10 00:50:15 382

原创 kafka 3.x 配置kerbos

第三步，准备 kafka-server-kerberos-start.sh 文件，添加 Kerberos 认证配置。2.3 准备 kafka-server-kerberos-start.sh 文件，添加 Kerberos 认证配置。拷贝 bin/kafka-server-start.sh 脚本，命名为 kafka-server-kerberos-start.sh，编辑最后一行，在最后一行代码之前，添加 Krb5 环境变量和 jaas.conf 配置信息。//不同的主机，需修改成不同的keytab文件。

2024-08-08 09:58:28 1007

原创 spark连接metastore(kerbors)揭秘

1、hivemeta开启meta后，spark-sql执行报错：解决方案：

2024-08-05 22:57:31 410

原创 dataX -20240804-master分支

1、修改dataX源码：HdfsHelper#getColumnTypeInspectors。2、修改dataX源码：HdfsHelper#transportOneRecord。2、重新打包dataX安装。

2024-08-04 17:07:50 365

原创 flink 1.17 测试

1、配置2、测试：

2024-08-01 22:49:41 341

原创 DataX 最新版本安装部署

1、下载2、打包。

2024-07-30 21:20:22 204

原创 Dolphinscheduler 3.2.1bug记录

问题1：

2024-07-30 21:11:04 242

原创 zeppline 连接flink 1.17报错

重新编译zepplin代码，适配当前的flink版本（验证中）

2024-07-29 09:42:20 300

原创 StarRock3.3 安装部署（存算分离、存算一体保姆式教程）

服务器前置要求：1、内存>=32GBwget。

2024-07-28 18:32:53 1408

原创 dolphinscheduler 3.2.1 如何访问开启kerbos的hadoop集群

对于api-server/conf/common.properties 进行配置变更。配置后文件管理和资源管理默认会使用hdfs分布式存储。

2024-07-24 22:11:41 103

原创 dolphinscheduler 3.2.1 datax报错jvm command not found

解决方案：在/etc/profile文件中增加下面的环境设置。

2024-07-23 23:47:25 170

原创 Jupyter如何优雅禁止termin

4、重启 Jupyter Notebook，使配置生效。3、修改 Jupyter Notebook 配置文件。1、在 Jupyter 配置目录下创建一个自定义的。

2024-07-23 23:20:19 374

原创 Apache Ranger 2.4.0 集成Hive 3.x(Kerbos)

看到下面的内容后，已经初始化完毕，需要重启meta和hive服务。服务正常，但是权限已经受到管控，需要进行授权。6.1 测试连接时出现下面报错。五、Ranger 授权。

2024-06-30 22:48:29 389

原创 Apache Ranger 2.4.0 集成hadoop 3.X(Kerbos)

参照上一个文章。

2024-06-30 21:52:50 992

原创 hadoop 3.X 分布式HA集成Kerbos(保姆级教程）

前提：先安装Kerbos。

2024-06-30 00:41:44 1199 1

原创 Apache Ranger 2.4.0 安装部署

ranger2.4.0安装部署

2024-06-30 00:30:26 731 2

原创深入浅出hdfs源码-读源码解析

深入浅出hdfs源码-读源码解析

2024-01-23 23:15:03 350 1

原创深入浅出hdfs-hadoop基本介绍

hadoop基本介绍，本文会从hadoop诞生之初到hadoop衍生出来的生态发展图看未来hadoop的发展之路

2024-01-23 23:05:58 520 1

原创深入浅出hdfs源码

37、hdfs snapshot源码解析。10、hdfs fsimage源码解析。15、hdfs metrics核心解析。18、hdfs balance源码解析。19、hdfs block管理核心解析。17、hdfs distcp源码解析。25、hdfs viewfs源码解析。31、hdfs 节点状态管理源码解析。28、hdfs mover源码解析。32、hdfs文件存储状态源码解析。11、hdfs节点上下线源码解析。24、hdfs 分层策略源码解析。33、hdfs文件元信息源码解析。

2024-01-10 23:52:28 367

原创 no matching host key type found. their offer: ssh-rsa解决方案

ssh 解决host key type found

2022-11-20 21:46:47 442 1

原创 hadoop3升级问题error safe-stable-stringify@2.3.1: The engine “node“ is incompatible with this module. Ex

mvn 编译报错：[INFO] Running 'yarn ' in /home/hadoop/hadoop-3.3.1-src/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-applications/hadoop-yarn-applications-catalog/hadoop-yarn-applications-catalog-webapp/target[DEBUG] Executing command line [/home/hadoop/hadoop-

2022-02-10 20:09:40 878

空空如也

空空如也