NASA EARTHDATA GES DISC不用爬虫基于插件DownThemAll批量下载数据

本文介绍如何利用DownThemAll插件在NASAEARTHDATAGESDISC网站上批量下载地球观测数据,避免了复杂的爬虫操作,通过直接获取下载链接并一键下载所有数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

NASA EARTHDATA GES DISC不用爬虫批量下载数据


由于NASA EARTHDATA GES DISC的数据集需要登录下载,使用爬虫下载不仅需要获取Cookie,而且保存速度很慢。
幸运的是NASA EARTHDATA GES DISC的网站提供每一个数据的下载链接。不需要用正则表达式筛选获取页面元素,直接复制链接表就能获得所有的下载链接。因此,用浏览器直接输入链接访问最简便。但是,数据量太大,DownThemAll可以解决问题。

下载插件DownThemAll

这个插件可以把一个网页上所有链接的文件下载下来
Firefox中的安装链接
Chrome浏览器的安装链接
Opera浏览器中安装链接
DownThemAll官方网站

Firefox浏览器中的DownThemAll!插件

找到数据集下载链接列表

  • 打开数据集页面,点击EarthdataSearch
    打开数据集页面,点击EarthdataSearch

  • 这个数据集就是我们要找的数据集,点击
    在这里插入图片描述

  • 根据日期地区选择数据获取的范围,点击加号选择需要的数据,点击下方绿色按钮Download。如果下载数据集中所有数据,点击Downloadall
    在这里插入图片描述

  • 点击DownloadDataList item

  • 选择Download LInks
    在这里插入图片描述

启动插件

  • 右击鼠标,选择Downloadall–Downloadall

  • 在这里插入图片描述

  • 选择所有文件,点击下载

  • 在这里插入图片描述

  • 由于页面中还有我们不需要的链接,我们可以用正则表达式在筛选器中筛选掉,或者手动删除。

  • 在这里插入图片描述

一个可自定义的扩展名,用于保存当前标签页中的选定图像 下载所有图像这是一个高度可定制的图像保护程序扩展程序,使您可以浏览和下载任何网页上显示的所有图像。 功能:1.可以检测当前页面中加载的所有图像,而不管它们是否嵌套在iframe中。2.许多过滤规则仅查找和下载所需的扩展名。3.可以捕获链接,后台脚本和CSS文件中的图像4。下载图像之前,先在图库视图中显示它们。5.支持两级深度图像搜索过滤器:1.按文件大小过滤2.按图像尺寸过滤3.按图像类型过滤4.按图像URL(正则表达式匹配)过滤5.按相同的来源策略过滤有关常见问题解答,请访问:http://add0n.com/save-images.html有关错误报告,请使用:https://github.com/belaviyo/save-images/issues注意:当您按时单击“保存”按钮,所有选择的图像均保存到浏览器的默认下载目录,或者如果指定子文件夹名称,则保存到浏览器中的目录。 更改日志:版本0.1.1现在,该扩展名将图像存储在子文件夹中(默认的子文件夹名称为域名)。修复了一个安全漏洞。 版本0.2.0图像现在保存在zip存档中,以防止多次下载,并且文件命名更好。改进了图像检测算法。 0.2.1版现在可以保留用户首选项。 仍然可以从UI重置它们。现在可以从UI要求“保存对话框”。有一个进度指示要处理多少个图像,当下载所有图像时,UI会自行关闭。 版本0.2.2通过所有链接进行深度图像搜索(最多两个级别)更新JSZip库版本0.3.4可以在新的浏览器选项卡中打开图库视图可以在图库视图中单击单个图像可以从以下位置下载图像版本0.3.7同时具有多个选项卡。两个新过滤器:删除相同的图像并使用列入黑名单的关键字删除图像现在,可以在不关闭UI的情况下停止UI的图像蜘蛛版本0.5.6 Deeps搜索级别3,该级别搜索两个链接和目标HTML页面中的图像自定义RegExp过滤器可提高搜索速度。 支持语言:English
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

冬_冬_

若觉得文章对您有用,请随意打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值