自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 airflow 2.2.1:HdfsSensor使用实操

概述HdfsSensor主要用于检查hdfs文件或目录是否存在实操案例描述:目前需要在airflow中增加一个任务,用于检测hdfs中的目标文件是否存在。文件绝对路径:/user/hdfs/for_test_2022-05-12.parquet代码如下from airflow import DAGfrom datetime import datetime, timedeltafrom airflow.providers.apache.hdfs.sensors.hdfs import Hd

2022-05-12 20:16:59 701

原创 airflow 2.2.1:HivePartitionSensor、自定义宏变量

airflow 2.21:HivePartitionSensorHivePartitionSensor功能用于检查hive表的分区是否存在,在某些场景下可以使用该sensor来替代ExternalTaskSensor,且使用起来更加便捷。场景描述在数仓中这么两种表:表1 :daily_table,该表是按天分区的表,一天跑一次。表2 :hour_table,该表是按照小时分区,每个小时跑一次。其中daily_table 依赖于 hour_table的执行,对于这种执行周期不同的任务,如果通过a

2021-12-31 19:48:59 2019 1

原创 Spring boot 自动注入KafkaTemplate 类时报错

Spring boot 自动注入KafkaTemplate 类时报错使用spring boot 的自动注入功能时,提示这样一个错误:Bean method ‘kafkaTemplate’ in ‘KafkaAutoConfiguration’ is not loaded后来解决了半天才发现实际上并不是代码错误,而是idea的设置有点毛病,然后按照下图修改了idea设置之后就没问题了。说明虽然提示有错,但实际上并不影响运行。所以,可以不用修改。但是如果影响运行,那就需要另寻办法了。...

2021-01-29 20:31:42 2126

原创 Spark提交流程源码分析

说明①此文主要以Yarn Cluster模式为例说明提交流程②spark版本3.0提交流程简图提交流程描述①在YARN Cluster模式下,任务提交后会创建yarn客户端yarnClient,通过客户端和ResourceManager通讯申请启动ApplicationMaster②随后ResourceManager分配container,在合适的NodeManager上启动ApplicationMaster。③ApplicationMaster主线程会启动一个子线程,命名为driver,然

2020-12-20 00:00:44 221 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除