2.airflow参数简介

比较重要的参数:

参数默认值说明
airflow_home/home/airflow/airflow01airflow home,由环境变量$AIRFLOW_HOME决定
dags_folder/home/airflow/airflow01/dagsdag python文件目录
base_log_folder/home/airflow/airflow01/logs主日志目录
executorSequentialExecutor, LocalExecutor, CeleryExecutorexecutor方式,分别为序列、本地、队列
sql_alchemy_connsqlite:home/airflow/airflow01/airflow.db数据库连接方式
sql_alchemy_pool_size5数据库线程池
sql_alchemy_pool_recycle3600数据库idle连接回收时间
parallelism32executor的并行度,即同时在一个executor上同时运行的task instance个数
dag_concurrency16调度器同时可以运行的task instance个数(跟上个参数啥关系?)
max_active_runs_per_dag16不懂~
load_examplesTrue是否载入示例
default_impersonation当不设置task的用户时,以此用户执行
security安全验证类似,如kerberos
default_ownerairflowoperator 绑定的默认用户名
default_cpus1operators 使用的cpu
default_ram512operators 使用的内存
base_urlhttp://localhost:8080webserver的URL
web_server_host0.0.0.0webserver的IP
web_server_port8080webserver的端口
web_server_ssl_certwebserver的certificate路径
web_server_ssl_keywebserver的key路径
web_server_worker_timeout120gunicorn webserver和worker的超时时间
worker_refresh_batch_size1webserver每次检测worker的个数。发现新的worker并杀死旧的worker
worker_refresh_interval |30webserver检测的时间间隔
access_logfile-webserver日志位置,-指标准输出
error_logfile-webserver日志位置,-指标准输出
expose_configFalse是否在页面上显示配置信息
authenticateFalsewebserver是否开始权限验证
filter_by_ownerFalse通过名称过滤dag,需要开启权限验证。
smtp_hostlocalhostsmtp主机
smtp_usersmtp上的用户
smtp_password密码
smtp_starttlsTrue使用tls协议
smtp_sslFalse使用ssl协议
smtp_portsmtp端口
smtp_mail_from发邮件的账户
celeryd_concurrency16
broker_urlsqla+mysql://airflow:airflow@localhost:3306/airflowcelery broker url
celery_result_backenddb+mysql://airflow:airflow@localhost:3306/airflowcelere result
job_heartbeat_sec5Task instances接收外部kill信号(来自cli或者webserver)的时间时隔
scheduler_heartbeat_sec5scheduler和task之间的心跳间隔(应该是跟executor)
scheduler_zombie_task_threshold300检测僵尸task的时间间隔
catchup_by_default不懂~

parallelism = number of physical python processes the scheduler can run
dag_concurrency = the number of TIs to be allowed to run PER-dag at once
max_active_runs_per_dag = number of dag runs (per-DAG) to allow running at once* parallelism = number of physical python processes the scheduler can run

  • dag_concurrency = the number of TIs to be allowed to run PER-dag at once
  • max_active_runs_per_dag = number of dag runs (per-DAG) to allow running at once

其它:
https://cwiki.apache.org/confluence/display/AIRFLOW/Common+Pitfalls





转载于:https://www.cnblogs.com/skyrim/p/7456166.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值