Geotrellis学(踩)习(坑)笔记(四)——ETL工具

本文详细记录了使用Geotrellis的ETL工具进行数据处理的全过程,包括理解ETL概念、配置输入输出文件、解决版本问题、处理生成的layer文件并进行渲染,最终成功显示为图像。
摘要由CSDN通过智能技术生成

 

看官方文档的时候看到geotrellis工具有一个看上去很强大的ETL工具,但是看了好几次都看不明白他到底是干什么的,理解和跑通ETL是一个超级曲折艰难的过程。这篇文章就来记录一下ETL的曲折过程~

首先ETL是个啥??

参考资料:https://docs.microsoft.com/en-us ... relational-data/etl

Extract, transform, and load (ETL) is a data pipeline used to collect data from various sources, transform the data according to business rules, and load it into a destination data store. The transformation work in ETL takes place in a specialized engine, and often involves using staging tables to temporarily hold data as it is being transformed and ultimately loaded to its destination.

The data transformation that takes place usually involves various operations, such as filtering, sorting, aggregating, joining data, cleaning data, deduplicating, and validating data.

ETL工具就是一个从数据仓库里抽取数据、转换数据和加载数据到目的端的过程。

这样说感觉还是很抽象,没有一个很具象的概念,那就先直接上手做吧~

首先我在geotrellis的geotrellis-chatta-demo里面把data全都拷贝到我的工程里,作为测试数据。

import geotrellis.raster.Tile
import geotrellis.spark.SpatialKey
import geotrellis.spark.etl.{Etl}
import geotrellis.spark.util.SparkUtils
import geotrellis.vector.ProjectedExtent
import org.apache.spark.{SparkConf}

object GeoTrellisETL {
  def main(args: Array[String]): Unit = {
    var args=new Array[String](6)
    args(0)="--input"
    args(1)="D:\\IdeaProjects\\GeotrellisETL\\data\\input.json"
    args(2)="--output"
    args(3)="D:\\IdeaProjects\\GeotrellisETL\\data\\output.json"
    args(4)="--backend-profiles"
    args(5)="D:\\IdeaProjects\\GeotrellisETL\\data\\backend-profiles.json"
    goETL(args)
}
  def goETL(args: Array[String]): Unit = {
    implicit val sc = SparkUtils.createSparkContext("GeoTrellis ETL SinglebandIngest", new SparkConf(true).setMaster("local"))
    try {
      Etl.ingest[ProjectedExtent, SpatialKey, Tile](args)
      println("finished!")

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值