周六接到一个小项目,客户把4例样本的clean数据放到一个名为clean.zip
的文件中。客户是通过百度网盘给的数据。由于客户比较着急要数据,所以直接使用bypy
把clean.zip
下载到远程服务器上。
查看文件【前提是已经配置好bypy。配置过程自行搜索】
$ bypy list
/apps/bypy ($t $f $s $m $d):
F clean.zip 22187547440 2024-01-20, 14:15:12 030fac8e4rc8a88fd7340357e7c31479
下载文件
bypy downfile clean.zip ./
一般来说解压zip
格式,可能会直接使用unzip
命令,但是报错了,如下:
unzip解压
$ unzip clean.zip
报错如下:
Archive: clean.zip
warning [clean.zip]: 17892579250 extra bytes at beginning or within zipfile
(attempting to process anyway)
error [clean.zip]: start of central directory not found;
zipfile corrupt.
(please check that you have transferred or created the zipfile in the
appropriate BINARY mode and that you have compiled UnZip properly)
猜测可能是由于客户在win上压缩的zip软件,然后我在linux上使用不同软件解压时造成的问题,不过我并未去验证跨系统压缩与解压zip可能会造成这个问题。毕竟能解决问题就可以了,不一定非要究因到底。
因此尝试了7z
软件进行解压,如下:
7z解压
$ conda install p7zip
$ 7z x clean.zip
正常解压,提示如下:
7-Zip [64] 15.09 beta : Copyright (c) 1999-2015 Igor Pavlov : 2015-10-16
p7zip Version 15.09 beta (locale=en_US.UTF-8,Utf16=on,HugeFiles=on,64 bits,192 CPUs x64)
Scanning the drive for archives:
1 file, 22187547440 bytes (21 GiB)
Extracting archive: clean.zip
--
Path = clean.zip
Type = zip
Physical Size = 22187547440
64-bit = +
Everything is Ok
Folders: 4
Files: 8
Size: 22184167341
Compressed: 22187547440
正常解压完毕。最终的文件名称就不给大家看了。