图中这个红圈的task,是我更新error记录的task,是某些特定的task特定情况会触发的。正常情况走的最下面的箭头的路径。但是现在就是就算只走了下面箭头的路径,红圈那个task依然被触发了。检查了半天才发现,它的TriggerRule设置的是NONE_FAILED (关于其他类型可以参考我这篇blog:Airflow 中的trigger_rule-CSDN博客),意思就是上游没有失败的就会触发,不论成功或者是skiped都会执行,就算你这次代码逻辑根本走不到它。
那怎么办呢?我的需求是上游某些task都可以到这个task,而且任意一个都可以单独触发它,如果不走这条分支情况也就是上游都是skip以及success(因为我上游存在逻辑task,必然存在success的上游,)并且代码逻辑不该它,就不会执行。研究了TriggerRule里面所有值发现,没有适合他的。任何一个值都不能适用这种情况。
解决方案
终于想出来一个解决方案
handle_check_test_rows_counts_valid_task_skipped_task = DummyOperator(
task_id='handle_check_test_rows_counts_valid_task_skipped',
dag=dag,
)
就是加一个dummy方法在前面,做一个缓冲,目的就是避免上游出现因为这种直连逻辑task执行成功,但是走的另一条路线,他的上游就出现了成功的task
把这个task和所有逻辑代码之间做一个隔离,这样的话要不走这条线,这些隔离方法永远都是skiped,所以这时候只需要把最后的update_transaction_for_error_task的TriggerRule设置成ONE_SUCCESS就行了,这样既满足任意一条线都可以触发它,又满足如果不走它这条线的情况就不会触发它。但是要记住每个需要单独的缓冲方法,不然缓冲方法的触发又会出现之前的情况
update_transaction_for_error_task = PythonOperator(
task_id='update_transaction_for_error',
provide_context=True,
python_callable=update_transaction_for_error,
trigger_rule=TriggerRule.ONE_SUCCESS,
dag=dag,
)