自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 【问题记录】解析大型XML(爆内存解决过程记录)

硬件条件:内存8G,可用内存7.76G,四核解析目标:每个文件均为.xml.gz。

2024-08-21 11:30:09 364

原创 【Airflow】TaskGroup使用实例

设置上下游任务的时候可以设为任务组,有必要时会应用于组内所有的任务。task group本质是将多个任务同时进行触发时,使用的。也就是一个节点需要有多个操作时,可以考虑使用task group。

2024-08-20 14:58:13 235

原创 【Airflow】基于数据的调度 -条件触发

Airflow的数据调度机制是以上游的producer DAG的结果为准,触发下游的Consumer DAG的。也就是说,producer中的任务执行的结果可以看作consumer的触发条件。producer中最后一个condition task中的逻辑改为:如果不满足更新条件,则不会执行将文件同步至FLIE_PATH的操作(即不会触发FLIE_PATH的变化)。所以数据调度的控制条件可以放在producer的最后一个任务中,或者是consumer的第一个任务中。DATA_PATH:存储原始数据的文件夹。

2024-07-19 14:22:50 356

原创 【Airflow】基于数据的调度 -使用实例

Airflow基于数据的调度实例

2024-07-17 11:39:47 441

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除