- 问题描述:
在使用airflow(1.9)的过程中,经常出现airflow scheduler中断的问题(改问题是访问mysql数据出错导致了,此处不做解释)。于是想到使用supervisor来管理scheduler,但是在使用supervisor过程中,scheduler的日志报包导入错误(ModuleNotFoundError
)。 - 排查原因:
supervisor:版本3.3.5,python环境2.6.6
airflow:版本1.9.0,python环境3.6.3
supervisor的配置文件如下[program:airflow_scheduler] command=/usr/local/bin/python3 /usr/local/bin/airflow scheduler user=huner environment=AIRFLOW_HOME="/home/huner/airflow" stderr_logfile=/home/huner/airflow/airflow-scheduler.err.log stdout_logfile=/home/huner/airflow/airflow-scheduler.out.log
ModuleNotFoundError
使想到当初安装python包时使用的pip install XXX --user
进行性的,使用这种方式安装的包会放到~/.local/
下,因此不需要root权限。会不会是环境变量不正确导致python运行时不能找到~/.local/
下安装的包?
python模块导入从sys.path所包含的路径查找
验证环境变量不正确,在shell中直接执行python3打印sys.path
对比使用supervisor执行python3打印sys.path
,发现supervisor得到的结果和直接执行果然PATH不一样,其中缺少了/home/sctele/.local/lib/python3.6/site-packages
正是ModuleNotFoundError
指向的package所在的位置。
验证方法如下:
第一步,创建python文件test.py
,写入打印PATH
的语句
第二步,在shell中执行import sys print(sys.path)
python3 test.py
第三步,编写supervisor配置文件,在supervisor中执行[program:test_python3] command=/usr/local/bin/python3 /home/hunter/test.py user=hunter environment=AIRFLOW_HOME="/home/hunter/airflow"
- 解决问题
已经找到原因,环境变量sys.path
缺失必要的值,只要把需要的值“加上”就可以了。
在添加环境变量时,又遇到了问题,如何添加环境变量。
python通过PYTHONPATH
环境变量初始化sys.path
,因此需要在编写supervisor配置文件时将指定PYTHONPATH
,在PYTHONPATH
中添加/home/sctele/.local/lib/python3.6/site-packages
便可以在sys.path中添加需要的路径。
需要说明的,这里设置的PYTHONPATH并不会导致[program:test_python3] command=/usr/local/bin/python3 /home/hunter/test.py user=hunter environment=AIRFLOW_HOME="/home/hunter/airflow", PYTHONPATH=/home/hunter/.local/lib/python3.6/site-packages
sys.path
中只有一条记录,而是会以附加的方式添加到sys.path
。 - 进一步探索
为什么shell中执行时不需要设置PYTHONPATH
,而supervisor需要呢?
首先要了解一下python的import机制,python中的模块site
负责模块导入路径的添加(Append module search paths for third-party packages to sys.path.
)。查看其main
方法,其中有一个addusersitepackages
的动作,是导入当前用户的module search paths
。进一步查看源码,是通过get_config_var('userbase')
获取~/.local
(sysconfig.py line 205
),而~
代表就是环境变量HOME
。
所以我们可以通过添加HOME
环境变量来让python正确的找到模块导入路径。[program:test_python3] command=/usr/local/bin/python3 /home/hunter/test.py user=hunter environment=AIRFLOW_HOME="/home/hunter/airflow", HOME=/home/hunter
- 总结
使用supervisor出现ModuleNotFoundError
错误时是因为sys.path
未加载所需模块所在的路径,可以通过设置environment
来指明所需模块的路径。
使用PYTHONPATH
指明:
environment=PYTHONPATH=/home/hunter/.local/lib/python3.6/site-packages
对于用户python路径(pip install XXX --user安装的位置)(~/.local),也可以通过指定HOME
来让python找到模块所在的路径:
environment=HOME=/home/hunter
supervisor环境变量
最新推荐文章于 2025-03-17 09:00:00 发布