修改hdfs和yarn pid文件路径
默认的pid文件是在/tmp下,/tmp目录下有些运维会配置定期清理历史文件,所以该pid文件也会被删除,设置到别的目录防止被删除后可能引起的问题
HADOOP_PID_DIR=/data/tmp
hdfs设置
yarn设置
运行hudi设置
在flink中通过hudi写parquet时候会用到hadoop-mapreduce-client-core.jar这个jar,所以需要添加$HADOOP_MAPRED_HOME/*到yarn.application.classpath配置中。
添加超级用户
groupadd supergroup
# root用户加入supergroup组
usermod -a -G supergroup root
# 同步系统的权限信息到HDFS
sudo -u hdfs hdfs dfsadmin -refreshUserToGroupsMappings
将root用户添加到hdfs超级用户组