Danbooru preprocess

最新推荐文章于 2024-06-15 09:44:46 发布

MrCharles

最新推荐文章于 2024-06-15 09:44:46 发布

阅读量2.8k

点赞数

文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/MrCharles/article/details/110221721

版权

无中生有GAN 专栏收录该内容

17 篇文章 30 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

博客介绍了如何获取Danbooru数据集的文件名列表，并详细说明了如何移除文件名中多余的裁剪步骤数字，以确保仅保留单独的人物图片。接着，文章讲解了如何生成类似CelebA格式的标签，为深度学习和机器学习任务做准备。

摘要由CSDN通过智能技术生成

获取所有的文件名列表

 ls portraits/ > portraits_filenames.txt
less portraits_filenames.txt

10000310.jpg
10000330.jpg
1000050.jpg
10000610.jpg
10000760.jpg
10000990.jpg
10001010.jpg
100010.jpg
*****

python:



def load_data_filter(args):
    """
    loads and yields image data from metadata files
    """
    data = []
    metadata_paths = find_metadata_files(
        os.path.join(args.directory, args.metadata_dir)
    )
    i = 0
    for path in metadata_paths:
        with open(path, "r") as f:
            for line in f:
                #if i >= args.max_examples:
                    #break
                example = json.loads(line)
                if tag_check(

了解本专栏