筛选kepler.csv中未下载到的kepid

In [1]

#判断输入字符串是否在路径中函数
import os
def findfile2(keyword):
    keyword="%.9d" % int(keyword)
    judgeExist=False
    root=os.path.join('C:\\Users\\96502\\kepler', keyword[0:4])
    if os.path.exists(root):
        filelist=[]
        for root,dirs,files in os.walk(root):
            for name in files:
                fitfile=filelist.append(os.path.join(root, name))
        for i in filelist:            
            if os.path.isfile(i):
                 #print(i)
                if keyword in os.path.split(i)[1]:
                     judgeExist=True    
                    #else:
                        #print('......no keyword!')
    return judgeExist

In [2]

#从csv中读取kepid调用findfile2函数
import pandas as pd
import numpy as np
df = pd.DataFrame(pd.read_csv("C:\\Users\\96502\\kepler\\dr24_tce_500.csv"),columns=['kepid'])
print(df)
kep_id=df.to_numpy()
print(kep_id[0])
my_array=np.empty([kep_id.size,1],dtype = str)
filelist=[]
for i in range(kep_id.size):
    temp=findfile2(kep_id[i])
    my_array[i]=temp
    print("处理第:"+str(i)+"个kepid:  "+str(temp))
# print(my_array)

In [3]

#输出
df2=pd.DataFrame(pd.read_csv("C:\\Users\\96502\\kepler\\dr24_tce_500.csv"))
df2.insert(0, 'flag', my_array)
filterDf=df2.flag[df2['flag']=='F']
df2=df2.drop(filterDf.index)
df2 = df2.reset_index()
df2.index=df2.index+1
df2['rowid'] = df2.index
del df2['flag']
del df2['index']
print(df2)
df2.to_csv('outputkepler24.csv',index=False)

reference:https://blog.csdn.net/lilong117194/article/details/74537595

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值