通过Gobblin的embedded功能可以追踪Gobbblin背后的运行机制。
embeddedGobblin在加载配置文件的同时,会执行Task类的线程任务。Task类是Gobblin的job主要执行场所,包括 jobId,taskId,taskState基本信息,forks分支,extractor,converter,datawriter,rowChecker组件,这些信息在Task初始化的时候赋予初值。每一个workUnitState对应一个task然后提交到线程池执行。
通过Gobblin的embedded功能可以追踪Gobbblin背后的运行机制。
embeddedGobblin在加载配置文件的同时,会执行Task类的线程任务。Task类是Gobblin的job主要执行场所,包括 jobId,taskId,taskState基本信息,forks分支,extractor,converter,datawriter,rowChecker组件,这些信息在Task初始化的时候赋予初值。每一个workUnitState对应一个task然后提交到线程池执行。