Datawhale AI夏令营第四期 AIGC方向 Task02笔记

XD_XDXD

于 2024-08-14 23:01:48 发布

阅读量302

点赞数 5

文章标签：人工智能 AIGC 笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XD_XDXD/article/details/141202121

版权

AIGC(AI-Generated Content)是通过人工智能技术自动生成内容的生产方式，很早就有专家指出，AIGC将是未来人工智能的重点方向，也将改造相关行业和领域生产内容的方式。

AI生成图片的快速发展，使诸多领域措手不及，如：摄影、美术等艺术领域正在面临前所未有的颠覆。

所有人来说，定期关注AI生图的最新能力情况都十分重要：

对于普通人来说，可以避免被常见的AI生图场景欺骗，偶尔也可以通过相关工具绘图
对于创作者来说，通过AI生图的工具可以提效，快速制作自己所需要的内容
对于技术人来说，了解AI生图的能力的玩法，可以更好地针对自己的业务进行开发和使用，甚至攻克难题开发更实用的工具。

从22年开始，AI生图步入大众视野，让各个领域无法忽视。但是AI制图的缺点也让人无法忘却，最早的几张AI图片无法将人的手画好，以及一些吃面用手抓的槽点。

原因在于，AI生图模型获得图片生成能力主要是通过学习 图片描述 以及 图片特征，尝试将这两者进行一一对应，存储在自己的记忆里。

在我们需要的时候，通过输入的文字，复现出来对应的图片特征，从而生成了我们需要的图片。

关于AI是否真正理解了图片背后所代表的世界的特征，是否理解了图片的含义，这个一直是科研界和产业界存在争议的话题，我们唯一可以确定的是——

由于每个模型用于训练的数据是有限的且不一定相同的，它们能匹配的描述和特征也是有限的，所以在风格、具体事物上，不同的模型会有很大的生成差异，且可能存在诸多与现实不符的情况。

而这些问题，就是业界和科研界持续在想办法解决的问题。

目前，本人有幸接触到了利用AI来制作图片的机会，经过几天的练习，本人大概也了解了大致有哪些步骤和程序。

1.环境设置与依赖安装

首先，代码通过一系列的!pip install和!pip uninstall命令来安装和卸载必要的Python包，确保运行环境中有正确的依赖库。

2.数据集加载与预处理

这部分从ModelScope加载了一个名为lowres_anime的数据集，并将数据集中的图像转换为RGB格式，保存到指定目录下，并创建一个JSONL文件，其中包含了图像路径和对应的文本标签“二次元”。

3.数据清洗与过滤

使用Data Juicer库配置并执行数据处理，包括图像尺寸过滤和宽高比过滤，以确保图像符合特定的质量标准。处理后的结果被保存为新的JSONL文件。

4.数据转换与特征提取

接下来，将处理过的数据转换为Pandas DataFrame，并使用CLIP模型对图像和文本进行编码，得到图像与文本之间的相似度分数。

5.自定义数据集与数据加载

定义了一个自定义的PyTorch数据集类CustomDataset，用于处理DataFrame中的数据，并创建一个DataLoader用于批量加载数据，再次利用CLIP模型计算图像与文本的相似度。

6.图像生成

最后，使用StableDiffusionPipeline根据不同的提示（prompt）生成二次元风格的图像，并保存这些图像。生成过程包括了设置不同的种子以获得多样化的输出，以及一些负面提示（negative prompt）以避免不期望的图像特性。

7.图像拼接

将生成的图像按顺序拼接成一个大图，并调整大小以适应特定的尺寸。

整体来看，这段代码实现了从数据集加载、预处理、特征提取、自定义数据集构建、到最终利用深度学习模型生成图像的完整工作流。
————————————————

以下是本人调整做出的图片

由于时间仓促，本人行文较为草率，其间有些过错请读者帮忙指出。

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/foxfur/article/details/141201537

关注

5
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。