2020年因疫情在家科研

事情还要从上周说起, 因为疫情的原因, 不得不在家科研.说起在家科研,效率低不说,真的是各种不便捷. 首先, 因为去年在外面实习, 我在实验室的电脑就被师弟征用了. 所以我只能远程(Teamview)连接服务器进行实验. 我要下一个220G的数据集, 因为数据集的网址要翻墙, 实验室服务器下载速度大概只有几十kb/s这我得下几个月啊. 于是乎, 我就去找啊找啊,找到了一个公众号发布的该数据的网盘下载链接. 为了下载这个数据我特意买了百度网盘的超级会员. (还好去年实习攒了点钱~哈哈哈 其实会员也就12块). 我最开始想直接在服务器上用百度网盘下载的, 奈何服务器是16.04的系统, 安装的百度网盘的deb文件始终无法正常启动软件(看到多数是说不支持16.04的系统, 只对18的系统支持). 那好吧, 又"托关系"(才一年不在实验室,我"大师姐"的地位就不复存在了) 借了师妹的电脑来用. 用了一星期的时间终于把数据下载传到了服务器(百度网盘SVIP的下载速度在我家的网速下是10M/s,奈何实验室的网速太太慢,用ftp传输到服务器只有1M/s). 下载下来的是56个压缩文件, 我发现其中有一个可以直接解压的后缀是.zip文件,而其余的55个都是.zip.0*(*为对应编号)是无法直接解压的. 那我就想是不是要把这些合并成一个压缩文件,然后再去解压. 这么操作完之后, 确实是可以解压的. 但解压出来的文件夹个数和官网给的csv文件里面对照发现少了14个文件夹的Image.问题出在哪一步呢. 我又去重新浏览了百度网盘的文件. 发现那个17编号可以直接解压的zip是19年11月上传,而其余的文件是18年5月. 我就去对比了一下这些文件的md5sum(可根据文件的内容计算文件的指纹密码,只要内容没变,指纹就是唯一的)和官方给的相比,只有17是和官网一致,而其余都不一样. 到这个时候, 我目测事情是这样的: 这个作者(网盘链接的上传者)一开始从官网下载了全部的数据(56个zip), 然后将数据重新打包压缩成了56个子文件(所有子文件的md5sum和官网给的相应的已经发生了改变),上传至百度网盘, 但是漏了一个17. 后面到19年估计有人用这个下载链接下载的时候发现少了一个17,然后作者直接从官网下载了第17个文件. 这就导致为啥会出现我一开始的问题. 真是坑...关键, 我发现这个问题后, 第一时间反应给了该公众号的工作人员, 却没有收到任何回复. 如果你也打算从某CV公众号提供的网盘链接下载DeepLesion医学图像数据集. 希望在你下载之前看到了这篇博文~

 

uploading.4e448015.gif正在上传…重新上传取消

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值