由于最近一段时间JTWC官网的数据无法获取http://www.metoc.navy.mil/jtwc/jtwc.html?western-pacific.官网留下,指不定啥时候又能进了。
我现在需要处理JTWC的台风路径数据,于是找到一个新的网站,该网站把多个观测站的数据都整合到一块,需要解析,不过有总比没有强。
https://www.ncdc.noaa.gov/ibtracs/index.php?name=ib-v4-access
可以根据整理好的CSV筛选数据,直接点CSV,或者进入网站https://www.ncei.noaa.gov/data/international-best-track-archive-for-climate-stewardship-ibtracs/v04r00/access/csv/
可以看到,它已经将数据按照区域分成不同的CSV表了,我需要的是西北太平洋的数据,于是下载WP.list那个CSV表格。
注意:一定要下载文档说明。该pdf文档是你看懂这个表格的关键。
这就可以找到对应的区域数据。
进去之后,发现数据特别多,大概是37万行,163列,我需要的是最佳台风路径数据,因此我需要把时间,经纬度,名字,风速,观测点机构(以防不是JTWC),Nature(哪个温度带)等信息。(可以根据需要找对应文档的数据含义选择需要的数据)
然后就开始处理数据了。我想要2000-2019年的数据,只需要删除其余时间的行,以及删除我不要的列。
- 将选择的WP(Western North Pacific)的数据中非TS(Tropical),NR(Not Reported),MX(Mixed)数据所在行删除。
(因为发现有的数据是NR的但穿插在TS中同时对比STI的数据,发现时间点也正确,因此把NR,MX也留下来了)
说明如下:
# 将选择的WP(Western North Pacific)的数据中非TS(Tropical),NR(Not Reported),MX(Mixed)数据所在行删除
def JTWC_Select_TS():
data = pd.read_csv('F:/Zhu/JTWC_download/Best_track/JTWC_Orginal.csv', encoding="ISO-8859-1")
Nature = (data.iloc[:, 4]).tolist() # 根据台风选区的气温带,筛选TS的
list = [] # 存储Nature不等于TS的行号
# 统计台风所属温度带,判断是否为'TS'
for i in range(len(Nature)):
if Nature[i] != 'TS' and Nature[i] != 'NR' and Nature[i