最近看关于ELT相关的东西,因为我们前面已经设计了数仓,是面向Gis的数仓设计,所有需要对一些Gis行业相关的数据提供一定的Spark处理能力,小数据量就基于docker进行处理,大数据量docker的处理规模和效率就满足不了,所有就先用GeoSpark处理了下数据
刚开始代码的坑主要在jar包不匹配,找不见某些函数
最后查了下官网的maven依赖关系,
pom.xml 内容
<dependency>
<groupId>org.datasyslab</groupId>
<artifactId>geospark</artifactId>
<version>1.2.0</version>
</dependency>
<dependency>
<groupId>org.datasyslab</groupId>
<artifactId>geospark-viz_2.3</artifactId>
<version>1.2.0</version>
</dependency>
<dependency>
<groupId>mysql</groupId>
<artifactId>mysql-connector-java</artifactId>