批量下载中国气象科学数据共享网的数据

由于项目需要,需要下载站点的降雨量和蒸散发数据,但是这网站做的又特别不人道,超过50M数据量无法直接下载,需要定制,定制后说提供ftp下载,尼玛打开定制记录,一条条记录在哪摆着,说好的ftp呢,一个个下这还不得点死。还好借用wget可以较容易实现批量下载,但这期间也遇到了不少问题,刚下没几条,就提示“当前下载用户过多,请稍后下载”,那就等吧,尼玛劳资凌晨起来下数据,还给提示这个,这是做的什么破玩意,还让不让下数据了,一气之下就用账号留了言,然后发了伊妹儿,果然第二天就可以稳当下数据了。。一步步来看如何实现数据的批量下载。

(1)登陆后点击定制记录可以看到摆着的一条条数据文件名,如下图所示。

(2)点击F12查看网页源码,如下图所示,可以看到每一条数据的下载地址和数据文件名;把整个网页的源码复制粘贴到一个新建的txt文本文件中,只需写一个简单的文本处理工具就可以把数据下载地址和文件名提取出来,这里已经写好,会和wget一起打包共享给大家。

(3)提取数据下载地址和数据文件名。这里的下载地址在源码的基础上添加了http://cdc.cma.gov.cn;提取的下载文件具体格式为:<下载地址><空格><文件名>,将文件保存在批量下载工具根目录即可,文件名为cma_src.txt,如下图所示

(4)使用wget批量下载数据

新建一个wget.bat文件,输入以下代码:

@echo off
.\wget-1.11.4-1-bin\bin\wget --post-data="userid=your_user_id&password=your_password" --save-cookies=cookie_wget --keep-session-cookies "http://cdc.cma.gov.cn/login.do"

for /F "tokens=1*" %%i in (cma_src.txt) do (
.\wget-1.11.4-1-bin\bin\wget --load-cookies=cookie_wget -c %%i -O .\data\%%j
)

需要修改的是用户名和密码,然后点击双击运行即可实现数据的批量下载。

最后附上工具下载地址:http://download.csdn.net/detail/liushuo_whu/8415929

-------------------------------2016年1月3日---------------------------------

气象网更新了,现在叫中国气象数据网,现在的数据检索需要生成订单,处理完成后以压缩包的形式下载,其中每个订单对应一个动态生成的ftp用户名和密码,如下图:

yGCxu1BXvJDmLU0Q4dXHHFg8l7k3M1Wt8UHTIAJMAEmUL8IkPrPz88P5A5MMQE5MQEmwASYABNgAg2XwP8BCyCjo18dwfAAAAAASUVORK5CYII=uploading.4e448015.gif转存失败重新上传取消yGCxu1BXvJDmLU0Q4dXHHFg8l7k3M1Wt8UHTIAJMAEmUL8IkPrPz88P5A5MMQE5MQEmwASYABNgAg2XwP8BCyCjo18dwfAAAAAASUVORK5CYII=uploading.4e448015.gif转存失败重新上传取消yGCxu1BXvJDmLU0Q4dXHHFg8l7k3M1Wt8UHTIAJMAEmUL8IkPrPz88P5A5MMQE5MQEmwASYABNgAg2XwP8BCyCjo18dwfAAAAAASUVORK5CYII=uploading.4e448015.gif转存失败重新上传取消

这点是比以前要好了,以前的都是一条条的记录,现在可以打包下载了。但是还存在另外一个问题,就是如果检索的数据有几千条,分了好多页,无法全选加入数据框,只能一页页的选择,不过还是比以前要好了。

  • 24
    点赞
  • 68
    收藏
    觉得还不错? 一键收藏
  • 15
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值