气象数据是在各项研究中都经常使用的数据,气象指标包括气温、风速、降水、能见度等指标,说到常用的能见度数据,最详细的能见度数据是具体到气象监测站点的能见度数据!
有关气象指标的监测站点数据,之前我们分享过1929-2022年全球气象站点的逐月平均气温、逐月最高气温数据、逐月最低气温数据和逐月平均降水量数据(均可查看之前的文章获悉详情)。本次我们为大家继续带来具体到气象监测站点的数据——1929-2022年全球气象站点的逐月平均能见度数据!
原始数据来源于美国国家海洋和大气管理局(NOAA)下设的国家环境信息中心(NCEI),原始数据以英里为单位,数据格式为csv,缺失数据用999.9表示。为了方便大家使用,我们对原始数据进行了一些处理,包括:①能见度单位转为米(m);②处理得到了shp和excel两种数据格式;③对于excel格式,将缺失数据表示为空值,对于shp格式,缺失值依然用999.9表示;④基于当月所有天数的平均能见度通过求平均值得到能见度的月平均值。该数据的其他重要信息包括数据坐标为GCS_WGS_1984,以2022年为例全球有12000多个气象观测站点,具体的数据处理方式会在下文详细介绍!
以下为数据的详细信息:
01 数据预览
该数据提供Shp和Excel两种数据格式,由于是逐月平均能见度数据,又有94多个年份,数据条数非常多,难以将所有年份保存在一个文件中。我们将每一年的数据保存为一个Shp文件和一个Excel文件,一共有94个年份,也就是有94个Shp文件和94个Excel文件。
我们先来看一下Excel格式的数据,每个Excel文件中包含有该年12个月每月的全球所有气象站点的平均能见度。
数据字段包括气象观测站点的编号(STATION)、气象观测站点的名称(NAME)、纬度(LATITUDE)和经度(LONGITUDE)以及每月平均能见度数据(例如2022-01)。
我们以2022年气象观测站点的每月平均能见度数据为例来预览一下:
接下来我们来看一下Shp格式的数据,同样每个Shp文件中都包含该年12个月每月的全球所有气象站点的平均能见度。
Shp格式数据的具体属性和Excel数据相同,我们以2022年气象站点的每月平均能见度数据为例来预览一下:
02 数据来源
数据来源于美国国家海洋和大气管理局(NOAA)下设的国家环境信息中心(NCEI),网址为:https://www.ncei.noaa.gov/data/global-summary-of-the-day/archive/,包括了1929—2022年的气象数据,
大家可以自己去该网站下载原始数据!
03 数据处理说明
1.合并处理:
从NCEI网站下载到的原始csv数据,每一个csv是某个特定站点1年内所有日期的平均能见度数据,按天记录,但并不全是365天,有的300多天,有的只有十几天。我们按照年份将每年涉及到的所有气象观测站点的每日平均能见度数据进行合并处理,最终得到以年份命名的1929-2022年全球范围气象站点的逐日平均能见度量数据。
2.平均处理:
然后基于所有站点的逐日平均能见度数值,我们求得每月所有天数的日平均能见度数据的平均值,以此分别得到所有站点的逐月平均能见度数据!
3.单位换算:
原始数据单位为英里(mile),根据公式1英里=1609.344米,将英里换算为米(meter)。
4.空值处理:
原始csv数据中的缺失值用数字999.9表示!在处理时,Excel格式文件用空值表示数据缺失;由于Shp文件会自动把空值识别为0,为区分空值与0米能见度,Shp中仍保留数字999.9表示数据缺失,特此说明!
5.站点数量说明:
每一年的站点数并不相同,基本是越新的年份全球气象站点数越多,2022年有12319个,早些年份的气象站点较少。有一点需要注意,对于缺失经纬度信息的站点,Excel中进行保留,其经纬度信息为空值。Shp中则将缺失经纬度信息的站点进行了删除。所以存在Excel和Shp中站点数量不一致的情况,例如2022年Shp中的站点个数为12281,Excel中的站点数量为12319。
文末下方是我们的公众号名片,我们将定期介绍各类城市数据以及数据的可视化和分析技术,有关1929-2022年全球站点的逐月平均能见度数据的更多详情,欢迎大家多多关注我们进行了解!