"""
对于每天存储文件,文件数量过多,占用空间
采用保存最新的三个文件
"""
from airflow import DAG
from airflow.operators.python_operator import PythonOperator
from airflow.models import Variable
from sctetl.airflow.utils import dateutils
from datetime import datetime,timedelta
import logging
import os
import shutil
"""
base_dir = "/data"
data_dir = "/gather"
"gather下边存在不同的文件夹"
"/data/gather/test"
"test路径下有以下文件夹"
"20180812、20180813、20180814、20180815、20180816"
"""
base_dir = Variable.get("base_dir")
data_dir = Variable.get("data_dir")
keep = 3
default_arg = {
"owner":"airflow",
"depends_on_past":False,
"start_date":dateutils.get_start_date_local(2018,8,27,18,5),
"email":[''],
"email_on_failure":False,
"email_on_retry":False,
"retries":
python 实现保存最新的三份文件,其余删掉
最新推荐文章于 2022-10-28 08:26:53 发布
本文介绍如何使用Python编写脚本,自动检查一个目录并仅保留最近创建的三个文件,删除所有其他文件。这对于在 airflow 工作流中管理日志文件或确保有限存储空间的有效利用非常有用。
摘要由CSDN通过智能技术生成