airflow中log表详解

10 篇文章 0 订阅
10 篇文章 3 订阅

标题: airflow中log表详解
日期: 2021-11-08 21:03:15
标签: [airflow, log]
分类: 调度系统

上次介绍了airflow元数据库表的大致作用,是干什么的,存储了哪些信息,接下来,我们就来一个一个介绍,表里面的字段是什么意思,我们怎么使用。

airflow-logo

图片来自pexels

这是表结构:

fieldtypenullkeydefaultextra
idint(11)NOPRI(NULL)auto_increment
dttmtimestamp(6)YES
dag_idvarchar(250)YESMUL
task_idvarchar(250)YES
eventvarchar(30)YES
execution_datetimestamp(6)YES
ownervarchar(500)YES
extratextYES

下面来一个个字段介绍。

  • id:自增主键
  • dttm:操作时间
  • dag_id:操作的dag_id,有可能为空,因为如果是airflow自动调度,或者是在命令行操作airflow,不针对某个单独的dag时,此字段就是空的;
  • task_id:类似dag_id,操作的不是task,那么该字段就是空的;
  • event
eventdescription
clearairflow页面上clear dag_run或者clear task,该动作是人为操作
cli_clearairflow命令方式clear dagrun:airflow clear dag_id -s start_date -e end_date
cli_create_userairflow create_user命令创建用户
cli_flowerairflow flower命令启动flower监控
cli_runairflow命令run dag
cli_schedulerairflow scheduler命令启动scheduler
cli_serve_logsairflow worker命令启动日志服务
cli_upgradedbairflow upgradedb命令升级数据库
cli_versionairflow version命令查看版本
cli_webserverairflow webserver命令启动webserver服务
cli_workerairflow worker命令启动worker
dagrun_successairflow页面标记dagrun为success的动作,该动作是人为操作
deleteairflow页面删除dag,该动作是人为操作
durationairflow页面查看task运行时长,该动作是人为操作
extra_linksairflow页面查看task的超链接,该动作是人为操作
failedairflow页面标记task失败,该动作是人为操作
ganttairflow页面查看task的甘特图,该动作是人为操作
get_logs_with_metadata不知道,应该跟查看日志有关
graphairflow页面查看graph图,该动作是人为操作
landing_timesairflow页面查看task运行结束时间统计图,该动作是人为操作
logairflow页面查看日志,该动作是人为操作
pausedairflow页面on/off dag,该动作是人为操作
refreshairflow页面refresh刷新dag,该动作是人为操作
renderedairflow页面查看渲染的变量,该动作是人为操作
runairflow页面run某个task,该动作是人为操作
runningairflow调度task,将task标记为running的动作,该动作是系统操作
successairflow页面标记task为success的动作,该动作是人为操作
task不知道,airflow task,应该是记录的airflow的task
treeairflow页面查看task结构树,该动作是人为操作
triesairflow页面查看task重试次数,该动作是人为操作
triggerairflow页面trigger dag任务,该动作是人为操作
xcomairflow页面查看task push或者pull的变量,xcom的功能后面讲如何使用,作用就是task之间传递数据用的功能。
  • execution_date:dag的计划执行时间
  • owner:操作的airflow用户,如果是命令操作,则是linux用户
  • extra:记录的是操作日志的命令信息

dog

总结:

  1. cli_前缀的event,标识通过命令方式操作airflow;
  2. 用户在页面的操作,每一个点击都会被记录为日志;
  3. airflow scheduler worker两个角色也可以认为是用户,也有对dag、task的操作记录;

好了,airflow元数据表log介绍完了。

有什么问题或者疑问,都可以跟我发邮件,欢迎一起讨论。

我会将三年的airflow经验分享出去,主要就是为了记录一下我的知识,并分享给你们。

后面继续介绍airflow元数据库的其他表。

再见。


书山有路勤为径,学海无涯苦作舟。

欢迎关注我的微信公众号,比较喜欢分享知识,也喜欢宠物,所以做了这2个公众号:
程序员写书

喜欢宠物的朋友可以关注:【电巴克宠物Pets】
电巴克宠物

一起学习,一起进步。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

chenzuoli

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值