kettle整合到web项目并运用quartz实现定时任务

目前正在做的项目需要用将主业务库的部分数据同步出去以作统计用,为了保持数据实时同步需要定时执行同步操作。同步工具运用了比较流行的ETL工具kettle,首先我们在kettle界面工具Spoon中设计好同步文件如 studentTableETL.ktr,然后在web项目通过quartz定时调用studentTableETL.ktr即可。


1、以下是pom.xml中的依赖包
<dependency>
	    <groupId>pentaho.kettle</groupId>
	    <artifactId>kettle-core</artifactId>
	    <version>3.2.0-GA</version>
		</dependency>
		<dependency>
		    <groupId>pentaho.kettle</groupId>
		    <artifactId>kettle-db</artifactId>
		    <version>3.2.0-GA</version>
		</dependency>
		<dependency>
		    <groupId>pentaho.kettle</groupId>
		    <artifactId>kettle-engine</artifactId>
		    <version>3.2.0-GA</version>
		</dependency>
		<dependency>
		    <groupId>pentaho.kettle</groupId>
		    <artifactId>kettle-ui-swt</artifactId>
		    <version>3.2.0-GA</version>
		</dependency>
		<dependency>
		    <groupId>pentaho.kettle</groupId>
		    <artifactId>kettle-vfs</artifactId>
		    <version>3.2.0-GA</version>
		</dependency>
		<dependency>
		    <groupId>ognl</groupId>
		    <artifactId>ognl</artifactId>
		    <version>3.0.3</version>
		</dependency>
		<dependency>
		   <groupId>org.quartz-scheduler</groupId>
		   <artifactId>quartz</artifactId>
		</dependency>
		<dependency>
		   <groupId>log4j</groupId>
		   <artifactId>log4j</artifactId>
		</dependency>
		<dependency>
		    <groupId>commons-digester</groupId>
		    <artifactId>commons-digester</artifactId>
		    <version>1.8</version>
		</dependency>


2、spring-quartz.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN 2.0//EN" "http://www.springframework.org/dtd/spring-beans-2.0.dtd">
<beans >
    <!-- Scheduler配置 -->   
    <bean id="myScheduler"  class="org.springframework.scheduling.quartz.SchedulerFactoryBean">   
        <!-- 自动启动 -->   
        <property name="autoStartup">   
            <value>true</value>   
        </property>   
        <property name="triggers">  
            <!-- 这里可以定时器任务列表 -->  
            <list>   
                <!-- 这里可以有多个定时器任务 --> 
                <ref bean="kettleTrigger"/>
            </list>
        </property>   
    </bean>   
  
   	<!--以下为Trigger配置-->
   <bean id="kettleTrigger" class="org.springframework.scheduling.quartz.CronTriggerFactoryBean">   
        <property name="jobDetail">   
            <ref bean="kettleDetail"/>   
        </property>
        <property name="cronExpression">   
            <!-- 每1分钟触发一次 -->
           <!-- value>0 * * * * ?</value-->
           <!-- 每天23点59分触发一次 -->
           <value>0 59 23 * * ?</value>
        </property>          
    </bean> 
    
      
    <!-- 以下为JobDetail定义 -->   
    <bean id="kettleDetail" class="org.springframework.scheduling.quartz.MethodInvokingJobDetailFactoryBean">   
        <property name="targetObject"><ref bean="kettleTimer"/></property>   
        <property name="targetMethod"><value>kettleEtl</value></property>   
        <property name="concurrent" value="false"/> <!-- 防止job并发执行 -->  
    </bean> 
   	
    <!-- Job定义-kettle ETL类 -->   
    <bean id="kettleTimer" class="com.anyuan.edu.sas.service.KettleLoader">   
   	</bean>  
   	
</beans>




3、KettleLoader.java

package com.anyuan.edu.sas.service;


import org.pentaho.di.core.exception.KettleException;  
import org.pentaho.di.core.util.EnvUtil;  
import org.pentaho.di.trans.StepLoader;  
import org.pentaho.di.trans.Trans;  
import org.pentaho.di.trans.TransMeta;  


/**
 * kettle文件加载类
 * @author gaozr
 *
 */




public class KettleLoader{
	public void kettleEtl() throws KettleException {
		String[] etlTables = {"classroomTableETL","studentTableETL","courseTableETL","chapterTableETL"};
        int monitor = 0;
        try{
			for(int i=0;i<etlTables.length;i++){
				monitor=i;
		    	String filename = "kettlefile/"+etlTables[i]+".ktr";  
		        callNativeTransWithParam(filename); 
		    }
        }catch(Exception e){
        	System.out.println(etlTables[monitor]+" failed");  
        }
        System.out.println("ok");  
    }  
	
    /** 
     * 调用本地的转换文件(带参数) 
     *  
     * @Description: 
     * @param transFileName 
     * @throws KettleException 
     */  
    public static void callNativeTransWithParam(String transFileName) throws KettleException {  
        // 初始化  
        EnvUtil.environmentInit();  
        StepLoader.init();  
        // 转换元对象  
        TransMeta transMeta = new TransMeta(transFileName);  
        // 转换  
        Trans trans = new Trans(transMeta);  
        String[] params = {};  
        // 执行转换  
        trans.execute(params);  
        // 等待转换执行结束  
        trans.waitUntilFinished();  
  
    } 
}
我这里每次执行4个ktr文件,所以定义了一个数组String[] etlTables = {"classroomTableETL","studentTableETL","courseTableETL","chapterTableETL"};然后循环调用

如果只有一个文件的话,就不需要这个循环了。


以下为项目结构



  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值