Azkaban4.0.0最新版的编译与安装
1 Azkaban的编译
- 下载Azkaban的源码,这里我下载的是最新版$4.0.0
- Azkaban的编译环境必须是Java1.8及以上,自行下载Java1.8的安装包上传并配置环境变量。
- 上传源码包到Linux服务器上,通过如下命令解压。
unzip azkaban-4.0.0.zip
- Azkaban使用的是gradle进行构建的,我这里直接下载一个gradle安装包,使用的版本为4.6的。
- 把下载好的安装包上传到服务器上并移动到Azkaban的源码目录中,目录如下
cp gradle-4.6-bin.zip azkaban-4.0.0/gradle/wrapper/
#然后修改这个目录的gradle-wrapper.properties配置文件
distributionUrl=gradle-4.6-bin.zip
- 安装git包
yum install -y git
- Azkaban4.0.0版本有有三个依赖的版本在中央仓库中下载不到,手动修改这三个jar的版本号,操作如下
'com.linkedin.pegasus:generator',
'com.linkedin.pegasus:restli-server',
'com.linkedin.pegasus:restli-tools',
#修改这三个包的版本为:27.7.18
- 开始编译,使用如下命令
./gradlew distTar
- 中间如果有下载不下来的包,重新编译即可,编译完成后,会有四个包,分别在如下目录
azkaban-4.0.0/azkaban-exec-server/build/distributions
azkaban-4.0.0/azkaban-solo-server/build/distributions
azkaban-4.0.0/azkaban-web-server/build/distributions
azkaban-4.0.0/azkaban-db/build/distributions
2 Azkaban的部署模式
2.1 Solo Mode
用于测试工作流的开发
- 最简单的模式:类似于本地模式
- 不使用MySQL存储元数据,用自带的H2数据库来存储元数据
- webserver和ExecServer都在一个JVM中
2.2 Two Server Mode
- Azkaban在3.x稳定之前最多的模式
- 用MySQL数据库来存储元数据
- WebServer和ExecServer是独立的进程,运行在不同的JVM中
- 一个WebServer节点、一个Exec节点
2.3 Multiple Executor Mode
- 相比较于Two Server模式的区别:该模式支持多个ExecServer。
- 3.0版本之后才支持的功能。
3 架构功能
- Azkaban WebServer
- 负责整个用户交互的界面
- Azkaban ExecServer
- 负责执行用户的工作流
- Mysql
- 负责存储用户的工作流,运行状态信息等等
- 用于存储Azkaban的元数据
##4 部署
在这里我们就部署Multiple Executor模式,选用3台机器,Azkaban WebServer和Azkaban ExecServer各部署一台机器。需要用到azkaban-db-0.1.0-SNAPSHOT.tar.gz、azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz、azkaban-web-server-0.1.0-SNAPSHOT.tar.gz这三个包,另外一个包在部署Solo Mode模式的时候才会用到。
4.1 配置数据库信息
##解压 azkaban-db-0.1.0-SNAPSHOT.tar.gz压缩包
tar -zxvf azkaban-db-0.1.0-SNAPSHOT.tar.gz
cd azkaban-db-0.1.0-SNAPSHOT
##登陆MySQL数据库
mysql -uroot -p
##创建azkaban的数据库
create database azkaban;
##创建azkaban的用户名
create user 'azkaban'@'%' identified by 'azkaban'
##对azkaban用户进行授权操作azkaban数据库
GRANT SELECT,INSERT,UPDATE,DELETE ON azkaban.* to 'azkaban'@'%' WITH GRANT OPTION;
##刷新权限
flush privileges;
##执行azkaban-db-xxx目录中的建表语句
source /root/create-all-sql-0.1.0-SNAPSHOT.sql;
4.2 安装WebServer
#上传azkaban-web-server-0.1.0-SNAPSHOT.tar.gz到其他一台Linux服务器上
#解压azkaban-web-server-0.1.0-SNAPSHOT.tar.gz
tar -zxvf azkaban-web-server-0.1.0-SNAPSHOT.tar.gz
cd azkaban-web-server-0.1.0-SNAPSHOT
#生成安全认证秘钥:Azkaban对于安全管理做得非常好,通过SLA、jetty等实现安全访问
keytool -keystore keystore -alias jetty -genkey -keyalg RSA
#输入秘钥库的密码:
#重新输入密码:
#你的名字?:
#单位?
#部门?
#区域?
#省份?
#国家缩写?CN
#是否确认?Y
#输入jettey,就是秘钥库密码:
#重新输入:
#根据自己的情况填写
#得到一个安全认证的秘钥文件,后续访问Azkaban,需要用到这个文件
4.3 修改Azkaban的配置文件
vim conf/azkaban.properties
azkaban.name=qywang
azkaban.label=Azkaban
azkaban.color=#FF3601
azkaban.default.servlet.path=/index
web.resource.dir=web/
default.timezone.id=Asia/Shanghai
# Azkaban UserManager class
user.manager.class=azkaban.user.XmlUserManager
user.manager.xml.file=conf/azkaban-users.xml
# Loader for projects
executor.global.properties=conf/global.properties
azkaban.project.dir=projects
# Velocity dev mode
velocity.dev.mode=false
# Azkaban Jetty server properties.
jetty.use.ssl=true
jetty.maxThreads=25
jetty.port=8443
#指定keystore文件的位置
jetty.keystore=/opt/cloudera/azkaban-web-server-0.1.0-SNAPSHOT/keystore
#keystore中的密码
jetty.password=azkaban
jetty.keypassword=azkaban
#指定keystore文件的位置
jetty.truststore=/opt/cloudera/azkaban-web-server-0.1.0-SNAPSHOT/keystore
#keystore中的密码
jetty.trustpassword=azkaban
# Azkaban Executor settings
# mail settings
mail.sender=
mail.host=
job.failure.email=
job.success.email=
lockdown.create.projects=false
cache.directory=cache
# JMX stats
jetty.connector.stats=true
executor.connector.stats=true
# Azkaban mysql settings by default. Users should configure their own username and password.
database.type=mysql
mysql.port=3306
mysql.host=192.168.50.1
mysql.database=azkaban
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100
#Multiple Executor
azkaban.use.multiple.executors=true
azkaban.executorselector.filters=StaticRemainingFlowSize,MinimumFreeMemory,CpuStatus
azkaban.executorselector.comparator.NumberOfAssignedFlowComparator=1
azkaban.executorselector.comparator.Memory=1
azkaban.executorselector.comparator.LastDispatched=1
azkaban.executorselector.comparator.CpuUsage=1
注意:这个脚本里面所有的配置文件都写了相对路径,启动Azkaban的时候,就在Azkaban的根目录中使用bin/start-web.sh启动,不然Azkaban会找不到配置文件
4.4 安装ExecServer
#上传azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz到其他一台Linux服务器上
#解压azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz
tar -zxvf azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz
vim azkaban-exec-server-0.1.0-SNAPSHOT/conf/azkaban.properties
# Azkaban Personalization Settings
default.timezone.id=Asia/Shanghai
# Loader for projects
executor.global.properties=conf/global.properties
azkaban.project.dir=projects
# Velocity dev mode
velocity.dev.mode=false
# Where the Azkaban web server is located
azkaban.webserver.url=http://v3:8443
# mail settings
mail.sender=
mail.host=
job.failure.email=
job.success.email=
lockdown.create.projects=false
cache.directory=cache
# JMX stats
jetty.connector.stats=true
executor.connector.stats=true
# Azkaban plugin settings
azkaban.jobtype.plugin.dir=plugins/jobtypes
# Azkaban mysql settings by default. Users should configure their own username and password.
database.type=mysql
mysql.port=3306
mysql.host=192.168.50.1
mysql.database=azkaban
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100
# Azkaban Executor settings
executor.maxThreads=50
executor.flow.threads=30
executor.props.resolve.overrideExisting.enabled=false
4.5 启动Azkaban
##一定要先启动ExecServer
cd /opt/cloudera/azkaban-exec-server-0.1.0-SNAPSHOT
#执行启动exec
bin/start-exec.sh
#每一次启动必须手动激活这个exec,要么手动修改数据库,要么执行以下命令
curl -G "192.168.50.1:$(<./executor.port)/executor?action=activate" && echo
## 启动WebServer
/opt/cloudera/azkaban-web-server-0.1.0-SNAPSHOT
bin/start-web.sh
##然后就可以在浏览器访问WebUI。
https://xxx.xxx.xxx.xxx:8443
默认用户名密码:azkaban/azkaban