从celeba 筛选 Male 属性, 3步完成（window与ubuntu 适用）

最新推荐文章于 2022-05-18 17:19:50 发布

Teleger

最新推荐文章于 2022-05-18 17:19:50 发布

阅读量183

点赞数 1

分类专栏： ubuntu python

本文链接：https://blog.csdn.net/teleger/article/details/110953009

版权

ubuntu 同时被 2 个专栏收录

65 篇文章 1 订阅

订阅专栏

python

22 篇文章 0 订阅

订阅专栏

从官网提供的链接中，获取到list_attr_celeba 文件.

step: 1

新建 main.py，并输入如下代码，（注意main.py与 list_attr_celeba 同级）

f = open("list_attr_celeba.txt")
newTxt = "Male.txt"
newf = open(newTxt, "a+")
newNoTxt = "FeMale.txt"
newNof = open(newNoTxt, "a+")

line = f.readline() 
line = f.readline() 
line = f.readline() 
while line:
    array = line.split()
    if (array[0] == "000011.jpg"): print(array[21])

    if (array[21] == "-1"): 
        new_context = array[0] + '\n'
        newNof.write(new_context)
    else: 
        new_context = array[0] + '\n'
        newf.write(new_context)
    line = f.readline()

lines = len(newf.readlines()) 
print ("There are %d lines in %s" % (lines, newTxt)) 
lines = len(newNof.readlines()) 
print ("There are %d lines in %s" % (lines, newNoTxt))

f.close()
newf.close()
newNof.close()

step 2:

运行 python main.py 得到了 FeMale.txt 以及 Male.txt　　　两个文件．

------------特别说明---------------------------

代码第 12 行： print(array[21])

对于为什么是打印这个21，详细请看我的另一博客 celebA数据集 40 属性介绍

--------------------------------------------------

step 3:

将生成的两个文件（FeMale.txt 以及 Male.txt）移到要处理的 20w 的文件夹，同目录：

如图：

note : 文件夹以及文件说明

FeMale (新建文件夹，用于存放女性)

Male (新建文件夹，用于存放男性)

img_celeba (待处理的图片，官网解压出来的)

move_images.py (用于将 img_celeba 的数据分开，分男女，按照 Male.txt,FeMale.txt （这两个文件，step2 已经完成）规则 )

blazeface.py && face_detection_front.tflite （用于裁剪人脸，用到tensorflow）

test_src ( 新建的文件夹, 从 img_celeba 中拷贝部分图片至该文件夹，用于测试使用 )

test_crop ( 新建的文件夹，运行python blazeface.py 保存的结果)

执行以下：

3A. python move_images.py

3B. python blazeface.py

下面是 move_images.py 代码：

import os
import shutil

nof = open("FeMale.txt")
hasf = open("Male.txt")

noLine = nof.readline() 
hasLine = hasf.readline() 

list_images = os.listdir("./img_celeba")
hasGo = True
noGo = True
for i in range(0, len(list_images)):
    imgName = os.path.basename(list_images[i])
    if (os.path.splitext(imgName)[1] != ".jpg"): continue

    noArray = noLine.split()
    if (len(noArray) < 1): noGo = False
    hasArray = hasLine.split()
    if (len(hasArray) < 1): hasGo = False

    if (noGo and (imgName == noArray[0])):
        oldname= "./img_celeba/"+imgName
        newname="./FeMale/"+imgName
        shutil.move(oldname, newname)
        noLine = nof.readline()
    elif (hasGo and (imgName == hasArray[0])):
        oldname= "./img_celeba/"+imgName
        newname="./Male/"+imgName
        shutil.move(oldname, newname)
        hasLine = hasf.readline()

    if (i % 100 == 0): print(imgName)

nof.close()
hasf.close()

筛选数据python 脚本参考

简书作者