从NASA中下载数据集后,发现有很多没有下载的文件。通过链接表和数据文件用肉眼比对很容易出错,就用python写了一个程序。
首先要把数据集存储在同一个路径下。
读入数据下载链接表文本文件
tuplelink=os.walk(r'F:\data\modisnc下载')#获取文件夹下的路径和文件,并生成元组 for tuple in tuplelink:#生成文件名元组 pass listlink=tuple[2]#生成文件名列表 misslist=[]
import os#导入os库
file = open(r"C:\Users\dell\Desktop\Except.txt")#读取连接表文件
filelist=[]#创建空列表
while 1:#读取文本文件中的链接
lines = file.readlines(100000)
if not lines:
break
for line in lines:
linne=line[-32:-1]#截取链接中的文件名
print(linne)
filelist.append(linne)
pass # do something
# print(os.getcwd(r'F:\data\modisnc下载'))
tuplelink=os.walk(r'F:\data\modisnc下载')#获取文件夹下的路径和文件,并生成元组
for tuple in tuplelink:#生成文件名元组
pass
listlink=tuple[2]#生成文件名列表
misslist=[]
# print('listlink',listlink[0])
# print('filelist',filelist[0])
l=len(listlink)
for i in range(l):#查找链接列表中每一个元素是否存在于文件名列表,并进行异常处理
try:
print(listlink.index(filelist[i]),filelist[i],'exists')
except:
print(listlink[i],'has missed')
misslist.append(listlink[i])
print(misslist,'are missed')