Danbooru preprocess

博客介绍了如何获取Danbooru数据集的文件名列表,并详细说明了如何移除文件名中多余的裁剪步骤数字,以确保仅保留单独的人物图片。接着,文章讲解了如何生成类似CelebA格式的标签,为深度学习和机器学习任务做准备。
摘要由CSDN通过智能技术生成

获取所有的文件名列表

 ls portraits/ > portraits_filenames.txt
less portraits_filenames.txt

10000310.jpg
10000330.jpg
1000050.jpg
10000610.jpg
10000760.jpg
10000990.jpg
10001010.jpg
100010.jpg
*****

python:



def load_data_filter(args):
    """
    loads and yields image data from metadata files
    """
    data = []
    metadata_paths = find_metadata_files(
        os.path.join(args.directory, args.metadata_dir)
    )
    i = 0
    for path in metadata_paths:
        with open(path, "r") as f:
            for line in f:
                #if i >= args.max_examples:
                    #break
                example = json.loads(line)
                if tag_check(
          
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MrCharles

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值