Azkaban Two Server模式部署

Azkaban Two Server模式部署

Two Server模式就是把Azkaban和MySQL进行了分离,下面就介绍一下这种部署模式。

1、准备工作

1.结点规划

node1:azkaban-web、azkaban-exec

node2:MySQL

这里本人将azkaban的相关服务放置到一台服务器中,将MySQL放置到另外一台服务器中。

2.服务器准备

两台服务器,服务器系统这里选择的是CentOS7。一台称之为node1、另外一台称之为node2。

  • 主机名称修改:根据自己的需求修改。
  • 添加主机名解析:
  • 免密登录:为了避免麻烦的操作,这里本人配置了免密登录。主机中如果安装了hadoop等大数据相关的软件,那么肯定已经配置过了。
  • 两台服务器都安装jdk,jdk版本1.8以上。
  • 编译源码,参见:Azkaban源码编译,此处使用的是Azkaban-3.66.0版本。
  • node2中安装MySQL,此处忽略安装MySQL的过程。详情参见:Linux中安装MySQL

2、MySQL相关操作

1.拷贝建表文件

在node2上创建一个放置建表文件的目录:

mkdir –p /home/script/azkabansql

到编译的目录中,将编译好的文件远程拷贝到目标主机:

cd /opt/azkaban/azkaban/azkaban-db/build/distributions/
scp azkaban-db-3.66.0-6-ge20c886.tar.gz root@node2:/home/script/azkabansql/

到node2上解压文件

cd /home/script/azkabansql
tar -zxvf azkaban-db-3.66.0-6-ge20c886.tar.gz

以上为解压出来的文件,这里需要使用的就是红框框起来的sql文件。

2.建库

在存放建表语句文件的目录下登录MySQL,如果不在此目录的话,建表文件使用非常麻烦。

mysql –u root –p
create database azkaban66;
use azkaban66

本人的数据库中已经有一个azkaban的数据库在使用了,这里本人创建了一个新的数据库,以azkaban的版本号结尾,数据库的名字可按需创建。

3.创建用户

这一步可以省略,你可以使用原有的root账户进行数据库的操作。

create user ‘azkaban’@’%’ identified by ‘azkaban’;

前一个azkaban是用户名,后一个azkaban是密码。

4.设置权限

给用户赋予权限

grant select,insert,update,delete on azkaban66.* to ‘azkaban’@’%’ with grant option;
flush privileges ;

5.建表

执行以下文件,进行建表:

source azkaban-db-3.66.0-6-ge20c886/create-all-sql-3.66.0-6-ge20c886.sql

如果不是在当前目录下进入MySQL的话,可以使用绝对路径来进行文件导入。

下图为数据库中建立的表:

6.修改字符集

如果如果想要使azkaban在创建项目的时候description支持中文输入,那么这里就需要更改一个表的一个字段的字符集即可。

需要修改的表为projects表。

使用数据库连接工具Navicat for MySQL,连接到库,右键projects表,选择设计表,出现如下图的界面:

选中字段,修改字符集为utf8,然后保存即可。

7.修改上传文件限制

有的时候,会上传的文件过大,超过MySQL接收的默认最大值,这里可以修改一下MySQL的默认最大值。

vim /etc/my.cnf

max_allowed_packet=1024M

修改完成之后,重启数据库。

3、拷贝文件

将编译好的文件拷贝到node2中规划的目录里去:

cd opt/azkaban/azkaban/azkaban-web-server/build/distributions/
cp azkaban-exec-server-3.66.0-6-ge20c886.tar.gz /opt/azkaban/
cd opt/azkaban/azkaban/azkaban-exec-server/build/distributions/
cp azkaban-web-server-3.66.0-6-ge20c886.tar.gz /opt/azkaban/
# 解压
cd /opt/azkaban/
tar -zxvf azkaban-web-server-3.66.0-6-ge20c886.tar.gz
tar -zxvf azkaban-exec-server-3.66.0-6-ge20c886.tar.gz

解压之后,web下的文件夹列表如下:

exec下的文件夹列表如下:

官方网站上提示:

  • web解压之后有如下几个目录:bin、conf、lib、web
  • exec解压之后有如下几个目录:bin、conf、lib、extlib、plugins

所以现在只有exec目录下少了一个文件。

4、配置exec

官方的文档顺序,是先配置的exec,这里也先从exec开始配置。

进入exec的conf目录中,可以看到有如下三个个文件:

其中global.properties是一个空的文件。

1.azkaban.properties

编辑此文件,命令如下:

vim azkaban.properties

文件的原始内容,如下图:

由官方文档得知,exec可以配置两大项内容:

  • 第一项是执行器服务器属性。
  • 第二项是MySQL连接属性。

下面开始配置,可将原来的文件中,不需要的属性注释掉,或者将原始文件改名复制一份,再进行修改。

# Azkaban Personalization Settings
# 可以将其他的属性注释掉或者删除,这里只配置时区这一项
default.timezone.id=Asia/Shanghai

# Azkaban UserManager class
# Loader for projects
executor.global.properties=conf/global.properties
azkaban.project.dir=projects
# Velocity dev mode
velocity.dev.mode=false
# Azkaban Jetty server properties.
# mail settings
lockdown.create.projects=false
cache.directory=cache
# JMX stats
jetty.connector.stats=true
executor.connector.stats=true
# Azkaban Executor settings
executor.maxThreads=50
executor.flow.threads=30
# 这里添加一个端口配置
executor.port=12321
azkaban.execution.dir=executions

# Azkaban plugin settings
azkaban.jobtype.plugin.dir=plugins/jobtypes
# Azkaban mysql settings by default. Users should configure their own username and password.
database.type=mysql
mysql.port=3306
mysql.host=MySQL的ip地址
mysql.database=azkaban66
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100

2.log4j.properties

打开此文件,文件中已经配置好了

3.启动

在exec的home目录下执行以下目录,启动exec服务:

bin/start-exec.sh

启动之后,home目录下的文件变为如下:

4.激活执行器

激活执行器有一个明显的地方可以看到,在数据库中executors表中,你可以查看当前服务器的active字段,没有激活的时候是0,激活之后是1。

如果不激活,那么在启动web的时候执行任务会报出找不到执行器的错误。

启动exec服务器之后,在exec服务器的home目录中立即执行如下命令,激活执行器:

curl -G "localhost:$(<./executor.port)/executor?action=activate" && echo

如下图:

经过后续的测试发现,每次重启exec服务器,都需要激活。

5、配置Web

1.生成keystore文件

进入web的目录,执行如下命令:

keytool -keystore keystore -alias jetty -genkey -keyalg RSA

此命令是固定的,不需要更改什么。如下是执行过程:

[root@node1 azkaban-web-server-3.66.0-6-ge20c886]# keytool -keystore keystore -alias jetty -genkey -keyalg RSA
Enter keystore password: #密码
Re-enter new password: #密码
What is your first and last name?
  [Unknown]:  
What is the name of your organizational unit?
  [Unknown]:  
What is the name of your organization?
  [Unknown]:  
What is the name of your City or Locality?
  [Unknown]:  
What is the name of your State or Province?
  [Unknown]:  
What is the two-letter country code for this unit?
  [Unknown]:  
Is CN=Unknown, OU=Unknown, O=Unknown, L=Unknown, ST=Unknown, C=Unknown correct?
  [no]:  y

Enter key password for <jetty>
	(RETURN if same as keystore password): #密码
Re-enter new password: #密码

此时在看web目录之下,多了一个keystore文件。

如果是在别的目录之下进行的这个命令操作,在相应的目录下会有这个文件,只要将这个文件拷贝到web目录下即可。

2.azkaban.properties

此文件在conf目录下:

cd conf/

由上图可以看到,conf目录下存在四个文件。

cp azkaban.properties azkban.properties.model #复制一份,以免出错
vim azkaban.properties

如下图,为原始的azkaban.properties文件中的内容:

下面进行内容修改:

# Azkaban Personalization Settings
azkaban.name=#按规划填写
azkaban.label=#按规划填写
azkaban.color=#FF3601
azkaban.default.servlet.path=/index
web.resource.dir=/opt/azkaban/azkaban-web-server-3.66.0-6-ge20c886/web/
default.timezone.id=Asia/Shanghai
# Azkaban UserManager class
user.manager.class=azkaban.user.XmlUserManager
user.manager.xml.file=/opt/azkaban/azkaban-web-server-3.66.0-6-ge20c886/conf/azkaban-users.xml
# Loader for projects
executor.global.properties=conf/global.properties
azkaban.project.dir=projects
# Velocity dev mode
velocity.dev.mode=false
# Azkaban Jetty server properties.
jetty.maxThreads=25
jetty.port=8081
jetty.ssl.port=8443
jetty.keystore=keystore
jetty.password=azkaban
jetty.keypassword=azkaban
jetty.truststore=keystore
jetty.trustpassword=azkaban
# Project Manager settings
project.temp.dir=/temp
project.version.retention=3
# Azkaban Executor settings
executor.port=12321
# mail settings
mail.sender=xxxxx@xxx.xx
mail.host=smtp.263.net
mail.user=xxxx@xxx.xx
mail.password=*********
# 以下两项可以不填
job.failure.email=
job.success.email=

lockdown.create.projects=false
cache.directory=cache
# JMX stats
jetty.connector.stats=true
executor.connector.stats=true
# Azkaban plugin settings
azkaban.jobtype.plugin.dir=plugins/jobtypes

# Azkaban mysql settings by default. Users should configure their own username and password.
database.type=mysql
mysql.port=3306
mysql.host=ip地址
mysql.database=azkaban66
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100
#Multiple Executor
azkaban.use.multiple.executors=true
azkaban.executorselector.filters=StaticRemainingFlowSize,MinimumFreeMemory,CpuStatus
azkaban.executorselector.comparator.NumberOfAssignedFlowComparator=1
azkaban.executorselector.comparator.Memory=1

在web的home目录下创建文件plugins/jobtypes,命令如下:

midir –p plugins/jobtypes

3.azkaban-users.xml

添加azkaban的用户,在此文件中操作,文件原始内容如下图:

如果要添加用户,就按照<user/>的格式添加即可。

4.log4j.properties

此文件和exec中的内容是一样的。

6、web配置的坑

1.第一坑

  • web.resource.dir项的值要使用绝对路径,否则web页面会没有美丽的界面。
  • user.manager.xml.file项的值要使用绝对路径,否则启动的时候会报找不到文件的错误。

2.第二坑:邮箱预警的坑

mail.sender、mail.host、mail.user、mail.password这四项每一项配置都不能少,端口可以不配置,而且mail.sender和mail.user的值是一样的,少一项或者配错一项都会报出错误,错误信息如下:

2018/12/28 15:56:01.187 +0800 ERROR [EmailMessage] [Azkaban] Connecting to SMTP server failed, attempt: 0
javax.mail.AuthenticationFailedException: 500 Error: bad syntax

        at com.sun.mail.smtp.SMTPTransport$Authenticator.authenticate(SMTPTransport.java:823)
        at com.sun.mail.smtp.SMTPTransport.authenticate(SMTPTransport.java:756)
        at com.sun.mail.smtp.SMTPTransport.protocolConnect(SMTPTransport.java:673)
        at javax.mail.Service.connect(Service.java:295)
        at azkaban.utils.JavaxMailSender.connect(JavaxMailSender.java:34)
        at azkaban.utils.EmailMessage.connectToSMTPServer(EmailMessage.java:220)
        at azkaban.utils.EmailMessage.retryConnectToSMTPServer(EmailMessage.java:230)
        at azkaban.utils.EmailMessage.sendEmail(EmailMessage.java:213)
        at azkaban.utils.Emailer.sendEmail(Emailer.java:220)
        at azkaban.utils.Emailer.alertOnSuccess(Emailer.java:153)
        at azkaban.executor.selector.ExecutionControllerUtils.alertUser(ExecutionControllerUtils.java:123)
        at azkaban.executor.ExecutionFinalizer.finalizeFlow(ExecutionFinalizer.java:98)
        at azkaban.executor.RunningExecutionsUpdater.updateExecutions(RunningExecutionsUpdater.java:131)
        at azkaban.executor.RunningExecutionsUpdaterThread.run(RunningExecutionsUpdaterThread.java:54)

在网上看到一个说这个错误信息解决方法的,要改源码,其实是配置信息写错了。

3.第三坑

azkaban.jobtype.plugin.dir=plugins/jobtypes这一项一定要配置,并且创建文件夹,不然会报错,错误信息如下:

2018/12/28 15:50:30.898 +0800 ERROR [FlowTriggerScheduler] [Azkaban] unable to get scheduled flow triggers
java.lang.NullPointerException
        at azkaban.flowtrigger.quartz.FlowTriggerScheduler.getScheduledFlowTriggerJobs(FlowTriggerScheduler.java:132)
        at azkaban.webapp.servlet.FlowTriggerServlet.handlePage(FlowTriggerServlet.java:140)
        at azkaban.webapp.servlet.FlowTriggerServlet.handleGet(FlowTriggerServlet.java:55)
        at azkaban.webapp.servlet.LoginAbstractAzkabanServlet.doGet(LoginAbstractAzkabanServlet.java:123)
        at javax.servlet.http.HttpServlet.service(HttpServlet.java:668)
        at javax.servlet.http.HttpServlet.service(HttpServlet.java:770)
        at org.mortbay.jetty.servlet.ServletHolder.handle(ServletHolder.java:511)
        at org.mortbay.jetty.servlet.ServletHandler.handle(ServletHandler.java:401)
        at org.mortbay.jetty.servlet.SessionHandler.handle(SessionHandler.java:182)
        at org.mortbay.jetty.handler.ContextHandler.handle(ContextHandler.java:766)
        at org.mortbay.jetty.handler.HandlerWrapper.handle(HandlerWrapper.java:152)
        at org.mortbay.jetty.Server.handle(Server.java:326)
        at org.mortbay.jetty.HttpConnection.handleRequest(HttpConnection.java:542)
        at org.mortbay.jetty.HttpConnection$RequestHandler.headerComplete(HttpConnection.java:928)
        at org.mortbay.jetty.HttpParser.parseNext(HttpParser.java:549)
        at org.mortbay.jetty.HttpParser.parseAvailable(HttpParser.java:212)
        at org.mortbay.jetty.HttpConnection.handle(HttpConnection.java:404)
        at org.mortbay.jetty.bio.SocketConnector$Connection.run(SocketConnector.java:228)
        at org.mortbay.jetty.security.SslSocketConnector$SslConnection.run(SslSocketConnector.java:713)
        at org.mortbay.thread.QueuedThreadPool$PoolThread.run(QueuedThreadPool.java:582)

4.第四坑

Multiple Executor的几项必须配置,不然的话会报出以下错误:

2018/12/28 15:43:28.406 +0800 ERROR [StdOutErrRedirect] [Azkaban] Exception in thread "main"
2018/12/28 15:43:28.406 +0800 ERROR [StdOutErrRedirect] [Azkaban] java.lang.IllegalArgumentException: azkaban.use.multiple.executors must be true. Single executor mode is not supported any more.
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban]       at azkaban.executor.ExecutorManager.checkMultiExecutorMode(ExecutorManager.java:240)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban]       at azkaban.executor.ExecutorManager.setupExecutors(ExecutorManager.java:229)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban]       at azkaban.executor.ExecutorManager.initialize(ExecutorManager.java:155)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban]       at azkaban.executor.ExecutorManager.start(ExecutorManager.java:168)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban]       at azkaban.webapp.AzkabanWebServer.launch(AzkabanWebServer.java:235)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban]       at azkaban.webapp.AzkabanWebServer.main(AzkabanWebServer.java:226)

5.第五坑:CDH集成

如果使用的是CDH平台安装的hadoop相关的软件,那么在启动Azkaban的时候日志第一行会出现如下的错误信息:

Error: HADOOP_HOME is not set. Hadoop job types will not run properly.

这个错误不影响Azkaban正常的执行hadoop相关的脚本。

这是因为CDH平台集成的Hadoop没有在profile中添加环境变量,这里需要在profile文件中添加两个环境变量。操作如下:

vim /etc/profile

要添加的内容如下:

export HADOOP_HOME=/opt/cloudera/parcels/CDH
export HADOOP_CONF_DIR=/etc/hadoop/conf.cloudera.yarn

添加完成source,让文件生效。

source /etc/profile

以上两条变量的值是CDH的目录,填写的时候,查看一下,自己的CDH安装是否是这两个目录,如果不是,值要根据自己的目录进行修改。

然后重启Azkaban web,日志中的错误消失,取代是如下内容:

Using Hadoop from /opt/cloudera/parcels/CDH

7、启动web

启动命令如下:

bin/start-web.sh

8、登录检测

在浏览器中输入:ip:8443,会出现如下图的登录界面:

由上图可以看出,红块的地方是填写的azkaban.name和azkaban.labe两项的值,这里本人打了码,配置完成你们即可看到自己的成果。

9、job测试

以下是本人准备的一个简答的脚本的job文件,weather.job:

type=command
command=/usr/java/default/jdk/bin/java -jar /home/script/Weather.jar
failure.emails=xxx@xxx.xx
success.emails=xxx@xxx.xx

上面两项邮箱相关的,一项是执行成功发送邮件,一项是执行失败发送邮件。邮箱自行填写。如果这里不填写邮箱,那么就不会给你发送执行结果。

将文件打成zip的压缩包上传到测试项目中,选择执行。

执行成功,也有邮件发送。

以上为整个Two Server模式配置的整个过程和踩过的坑。

上一篇:Azkaban Solo Server模式部署

下一遍:

转载于:https://my.oschina.net/u/3754001/blog/2995216

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值