摘要
为解决自然资源信息化体系建设过程中的数据整合问题,更加高效、安全、灵活地实现自然资源各部门业务的数据转换、同步工作,从业务需求角度出发,分析数据整合技术的应用现状,开展对开源ETL工具Kettle的研究。通过分析Kettle的概念模型及应用场景,结合自然资源信息化体系建设中数据多源、数据量大、结构复杂的特点,构建基于Kettle的源数据库转换同步环境,并提出一种新的基于Kettle的数据转换同步方法。在实际项目案例中进行应用验证,与传统方法相比,基于Kettle的数据转换同步方法提高了ETL的开发速度和工作效率,不仅解决了自然资源信息化建设过程中多源数据到目标数据的转换、同步难题,同时也为其他企业数据集成工作提供了更多思路。
0 引言
随着自然资源信息化体系的完善,各机构改革逐步落实到位。如何更加高效、安全、灵活地实现各部门、各应用系统之间的数据转换、同步及迁移工作成为当前自然资源信息化建设面临的重要难题