写在前面
首先本文原作者为:Mohit Kaushik,翻译行为已获得本人许可。
英文原文地址:Reading and Visualizing GeoTiff | Satellite Images with Python
翻译原文地址:基于Python的遥感可视化记录
最近在做一些基础遥感分析,需要对处理后影像可视化,课本上的方法很原始,带着你造一遍轮子,从地理坐标到转到像素坐标……,本着偷懒的原则,有意中发现这篇遥感可视化文章。
使用Python读取图像非常简单,因为针对不同的图像格式,它提供了简便的第三方库,用来读取、可视化、编辑等,例如Matplotlib、OpenCV、Pillow……。上述库对于流行的常见图像格式,如png、jpg、jpeg 可以流畅处理,但是对于GeoTiff格式却不行,如果你熟知GeoTiff格式和其他图像格式之间的区别,想必一定能猜到其中的缘由。
GeoTIff 是一个标准的.tif 文件或是一个图像文件格式,它包含了一些额外的空间信息,这些信息被当成附属信息(tag),集成在.tif文件内。这些附属信息包含了空间范围、地理参考系统(CRS)、分辨率,以及每一个像素的值。基于此,GeoTiff是一种非常理想的遥感影像和航空相片分发格式。
本文讨论几种在jupyter notebook环境中利用Python读取的可视化的方式,主要用到如下几个库:GDAL、Rasterio、georaster以及Matplotlib。这些库可以帮助我们快速地将图像转换为Numpy库的数组(array)格式,然后我们就可以通过TensorFlow或numpy做一些图像转换,尽管本文没有涉及。
关于Python库的安装,网上有相对比较详细的介绍,这里就不一一记录了。
基于GDAL
首先肯定是老大哥了,gdal是最流行的GeoTiff处理库,但是嘛比较难以安装,并且不易上手,GDAL拥有由C++编写的方法和类,这里我们使用它的Python绑定。绝大部分的库,诸如georaster等,也是在运用GDAL的基础上,开发出符合Python风格的接口。
from osgeo import gdal
import matplotlib.pyplot as plt
dataset = gdal.Open("./raster/Yunnan_light.tif", gdal.GA_ReadOnly)
band = dataset.GetRasterBand(1) # 波段序号从1开始,而不是0
plt.figure(figsize=(10, 10))
plt.imshow(band.ReadAsArray())
plt.show()
基于Rasterio
Rasterio由mapbox团队开发,它提供了一系列用于读取地理空间数据的Python接口。
它可以配合Matplotlib库使用。
另外,rasterio拥有自身的可视化方法。
发现不同没有,上面这张图,它的坐标显示的是经纬度,而不是数字。
基于georaster
georaster 出现一些问题,读取包含多个波段的图像时,按照官方的示例代码会出现问题,上github查看后发现该库已经被标记放弃了,不会再做进一步的维护,也就没有再细究(比较懒哈哈)。