数据标注员工作笔记:文档内有无文件筛选

代码源自不愿意姓名的志华哥

#读取文件
import os
List=[]
None_list=[]
Path = '/home/SENSETIME/huangyaoqi_vendor/下载/~标准人物库'

def Discriminate_file(Path,List,None_list):  
    for file in os.listdir(Path):  
        file_path = os.path.join(Path, file)
        if os.path.isdir(file_path):
            if len(os.listdir(file_path)) ==0 :
                None_list.append(file_path.split('/')[-1])
            Discriminate_file(file_path, List,None_list)
        if os.path.splitext(file)[1] =='.jpg' or os.path.splitext(file)[1] =='.png' or os.path.splitext(file)[1] =='.jpeg' or  os.path.splitext(file)[1] =='.webp' :
            print(file_path.split('/')[-1])
            List.append(file_path.split('/')[-2])
#开始进行筛选:原理为包含剔除            
Discriminate_file(Path,List,None_list)
 list_=List
 no=None_list
 def clear_file(list_,no):
     for i in range(len(list_)-1,-1,-1):
         for j in range(len(no)-1,-1,-1):
             if list_[i] == no[j]:
                 del no[j]
     return n
 clear_file(list_,no)
#检验过程
import pandas as pd
pd.DataFrame(pd.DataFrame(List)[0].values==['毛建新'])[0].value_counts()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mario cai

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值