1、配置java环境:
flume启动需要java环境,需要安装JDK,配置JAVA_HOME,TDH安装包里就有1.7版本的jdk
rpm包(transwarp/transwarp/hadoop/jdk目录下),拷过去rpm -i 安装,然后配置环境变量。
2、安装flume组件:
安装包里有1.6版本的flume rpm包(transwarp/transwarp/hadoop/flume目录下),rpm
-ivh flume-1.6.0+43.28791-1.el6.noarch.rpm
–nodeps 安装即可,默认安装目录为/usr/lib/flume。也可以去官网下载其他的版本,解压即可。
3、准备依赖jar包:
测试时,配置的是hdfssink,启动是会依赖一些jar包,都可以在TDH集群内部/usr/lib下找到,拷贝过来放到flume安装路径的lib目录下面,不同的flume
sink需要的依赖的jar应该不一样,不过根据启动时的报错信息应该都可以找到: hadoop-common-2.5.2-transwarp-tdh450.jar hadoop-annotations-2.5.2-transwarp-tdh450.jar hadoop-auth-2.5.2-transwarp-tdh450.jar hadoop-nfs-2.5.2-transwarp-tdh450.jar
4、kerberos相关配置: (1)拷贝kerberos配置文件(/etc/krb5.conf)到flume安装目录的conf目录下。 (2)拷贝hdfs的配置文件(hdfs-site.xml、core-site.xml
在TDH集群外部署flume并通过kerberos认证
最新推荐文章于 2023-03-22 10:26:28 发布
本文档介绍了如何在TDH集群外部部署Flume,并通过Kerberos进行认证。首先,配置Java环境,接着安装Flume组件。然后,准备HDFS sink所需的依赖jar包。对于Kerberos认证,需要拷贝相关配置文件,包括krb5.conf、hdfs-site.xml和core-site.xml,以及设置主机名映射和keytab文件。配置Flume agent时,要包含Kerberos认证的相关设置,并启动Flume agent。
摘要由CSDN通过智能技术生成