项目部署时,一些批处理工作可能需要定时执行,如每天进行统计、每天清理系统垃圾、定期进行ETL工作等等都需要定时执行命令。在Linux中,定时通过spark-submit提交任务可使用crontab来实现。
1.安装crontab。CentOS系统并未自带crontab,可使用yum安装
yum install vixie-cron crontabs
2.将需要执行的spark-submit命令做成shell脚本。即创建sh文件,如sparkShell.sh文件,内容为:
#!/bin/bash
spark-submit /usr/zlp/wbfiveconnectins.jar > /usr/zlp/log1229.out
3.编辑crontab
crontab -e
随即进入vim界面,输入
1 0 * * * . /etc/profile;/bin/sh /usr/zlp/sparkShell.sh