13行MATLAB代码实现网络爬虫 爬取NASA画廊星图

本文介绍了如何使用13行MATLAB代码创建一个网络爬虫,专门爬取NASA画廊的星图。该爬虫支持下载指定数量的图片,并能处理一些错误情况,将下载进度和报错信息记录在日志中。用户只需将脚本加入MATLAB路径,运行后按提示输入图片数量即可开始爬取。爬虫的工作原理是通过分析网页接口,拼接URL以获取不同编号的图片链接,最后利用MATLAB下载并保存图片。
摘要由CSDN通过智能技术生成

13行MATLAB代码实现网络爬虫 爬取NASA画廊星图


2021/04/18​上传

2021/04/21更新:修改N的输入方式,增加对png格式图片的下载支持,增加了自动处理几种错误情况的代码,能够将下载过程与报错记录保存到日志中。

源代码

N = input('Input the number you want to download:');
    URL = 'https://www.nasa.gov/api/2/ubernode/_search';
mainURL = 'https://www.nasa.gov/sites/default/files/';
opt = weboptions('Timeout',10);
for i=1:N
    data = webread(URL,'size',num2str(N),'from','0','sort','promo-date-time:desc','q','((ubernode-type:image) AND (routes:1446))','_source_include','promo-date-time,master-image,nid,title,topics,missions,collections,other-tags,ubernode-type,primary-tag,secondary-tag,cardfeed-title,type,collection-asset-link,link-or-attachment,pr-leader-sentence,image-feature-capt
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值