需求是批量提取某段时间、某个区域内的这个数据里的叶绿素a的值。刚了解这个数据,许多地方我也不懂。
一、 介绍
这个数据是利用放到海里的浮标上配备的生物地球化学传感器,测量海洋中的生物地球化学参数,比如叶绿素a、溶解氧、溶解有机物、海洋酸碱度。
存储格式是netCDF(.nc),用Python自带库netCDF4库就可以轻松读取。参数存储在variables里面,但不是所有的文件都有叶绿素a值,得经过筛选。包括想要哪一年的或者哪个地点的数据都得筛选,筛选比较好用的包是pandas。
读取完之后,里面有几个东西不太理解:
1. 数据采集的时候,浮标在观测过程中在不同深度层次上进行连续测量,获得垂直剖面上的数据。每个观测剖面可能包含多个深度层次,每个深度层次测量了一系列的海洋参数。在variables里面,N_LEVELS代表有几个深度层,每个浮标深度层数不一样。所以在一个时间一个经纬度可能存在很多CHLA值,原因就是深度不一样。
2. CHLA是一个列表,这个列表里有很多值,按空格分开,每隔几个用一个逗号分开,并且有很多nan值,应该需要质量控制,这个还没有太了解。
暂时就知道这么多,头疼