最近在做ETL任务调度时,使用系统自带的任务调度crontab 发现手动运行脚本可以执行完成,但是自动定时就不能实现,检查shell脚本也没有错误。奇怪哪里导致的问题呢?
后来在网上查询和不断测试,得知和系统的环境变量有关系的。发现脚本中需要添加必要的环境变量才可以使脚本自动执行。
这种情况一般是由于在crontab文件中没有配置环境变量引起的。cron从用户所在的主目录中使用shell调用需要执行的命令。cron为每个shell提供了一个默认的环境,Linux下的定义如下:
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=用户名
HOME=用户主目录
在crontab文件中定义多个调度任务时,需要特别注意的一个问题就是环境变量的设置,因为我们手动执行某个脚本时,是在当前shell环境下进行的,程序能找到环境变量;而系统自动执行任务调度时,除了默认的环境,是不会加载任何其他环境变量的。因此就需要在crontab文件中指定任务运行所需的所有环境变量。
不要假定cron知道所需要的特殊环境,它其实并不知道。所以用户要保证在shell脚本中提供所有必要的路径和环境变量,除了一些自动设置的全局变量。以下三点需要注意:
1. 脚本中涉及文件路径时写绝对路径;
2. 脚本执行要用到环境变量时,通过source命令显式引入,例如:
#!/bin/sh
source/etc/profile
3. 当手动执行脚本没问题,但是crontab不执行时,可以尝试在crontab中直接引入环境变量解决问题,例如:
0****./etc/profile;/bin/sh/path/to/myscript.sh
好了,这个问题就这样解决了,反正是加上环境变量没错的。
================================================================================================
对linux 定时任务的一些附加说明解释
提供cron服务的进程名为crond,这是Linux下一个用来周期性执行某种任务或处理某些事件的守护进程。当安装完操作系统后,会自动启动crond进程,它每分钟会定期检查是否有要执行的任务,如果有则自动执行该任务。
Linux下的任务调度分为两类,系统任务调度和用户任务调度。
?系统任务调度:系统需要周期性执行的工作,比如写缓存数据到硬盘、日志清理等。在/etc目录下有一个crontab文件,这个就是系统任务调度的配置文件。
?用户任务调度:用户要定期执行的工作,比如用户数据备份、定时邮件提醒等。用户可以使用crontab命令来定制自己的计划任务。所有用户定义的crontab文件都被保存在/var/spool/cron目录中,其文件名与用户名一致。
1.crontab权限
Linux系统使用一对allow/deny文件组合判断用户是否具有执行crontab的权限。如果用户名出现在/etc/cron.allow文件中,则该用户允许执行crontab命令。如果此文件不存在,那么如果用户名没有出现在/etc/cron.deny文件中,则该用户允许执行crontab命令。如果只存在cron.deny文件,并且该文件是空的,则所有用户都可以使用crontab命令。如果这两个文件都不存在,那么只有root用户可以执行crontab命令。allow/deny文件由每行一个用户名构成。
2.crontab命令
通过crontab命令,我们可以在固定间隔的时间点执行指定的系统指令或shell脚本。时间间隔的单位可以是分钟、小时、日、月、周及以上的任意组合。crontab命令格式如下:
crontab[-uuser]file
crontab[-uuser][-e|-l|-r]
说明:
?-uuser:用来设定某个用户的crontab服务,此参数一般由root用户使用。
?file:file是命令文件的名字,表示将file作为crontab的任务列表文件并载入crontab。如果在命令行中没有指定这个文件,crontab命令将接受标准输入,通常是键盘上键入的命令,并将它们载入crontab。
?-e:编辑某个用户的crontab文件内容。如果不指定用户,则表示编辑当前用户的crontab文件。如果文件不存在,则创建一个。
?-l:显示某个用户的crontab文件内容,如果不指定用户,则表示显示当前用户的crontab文件内容。
?-r:从/var/spool/cron目录中删除某个用户的crontab文件,如果不指定用户,则默认删除当前用户的crontab文件。
注意:如果不经意地输入了不带任何参数的crontab命令,不要使用Control-d退出,因为这会删除用户所对应的crontab文件中的所有条目。代替的方法是用Control-c退出。
3.crontab文件
用户所建立的crontab文件中,每一行都代表一项任务,每行的每个字段代表一项设置。它的格式共分为六个字段,前五段是时间设定段,第六段是要执行的命令段,格式如下:
.----------------分钟(0-59)
|.-------------小时(0-23)
||.----------日期(1-31)
|||.-------月份(1-12)
||||.----星期(0-6,代表周日到周一)
|||||
*****要执行的命令,可以是系统命令,也可以是自己编写的脚本文件。
在以上各个时间字段中,还可以使用如下特殊字符:
?星号(*):代表所有可能的值,例如“月份”字段如果是星号,则表示在满足其他字段的制约条件后每月都执行该命令操作。
?逗号(,):可以用逗号隔开的值指定一个列表范围,例如,“1,2,5,7,8,9”。
?中杠(-):可以用整数之间的中杠表示一个整数范围,例如“2-6”表示“2,3,4,5,6”。
?正斜线(/):可以用正斜线指定时间的间隔频率,例如“0-23/2”表示每两小时执行一次。同时正斜线可以和星号一起使用,例如*/10,如果用在“分钟”字段,表示每十分钟执行一次。
注意,“日期”和“星期”字段都可以指定哪天执行,如果两个字段都设置了,则执行的日期是两个字段的并集。
4.crontab示例
#每1分钟执行一次command
*****command
#每小时的第3和第15分钟执行
3,15****command
#在上午8点到11点的第3和第15分钟执行
3,158-11***command
#每隔两天的上午8点到11点的第3和第15分钟执行
3,158-11*/2**command
#每个星期一的上午8点到11点的第3和第15分钟执行
3,158-11**1command
#每晚的21:30执行
3021***command
#每月1、10、22日的4:45执行
4541,10,22**command
#每周六、周日的1:10执行
101**6,0command
#每天18:00至23:00之间每隔30分钟执行
0,3018-23***command
#每星期六的晚上11:00执行
023**6command
#每一小时执行一次
**/1***command
#晚上11点到早上7点之间,每隔一小时执行一次
*23-7/1***command
#每月的4号与每周一到周三的11点执行
0114*1-3command
#一月一号的4点执行
0411*command
#每小时执行/etc/cron.hourly目录内的脚本
01****rootrun-parts/etc/cron.hourly
说明:run-parts会遍历目标文件夹,执行第一层目录下具有可执行权限的文件;