Datawhale X 魔搭 AI夏令营 第四期-AIGC文生图 Task2学习和实际操作日记

Task2是Task1代码的精讲,俗话说得好,授人以鱼不如授人以渔~代码的详细解读,可以帮我们理解大模型的代码编写原理,说不定之后自己可以开发出一款AI应用(梦想还是要有的!)

第一部分,从整体拆分Task1代码

       我们编写代码,是使用Python,而Python本身是不含任何系统库,需要安装所需的系统才行。这一步,就是我在运行task1代码时,出错了好几次的地方(so sad)

       第二步,是加载动漫图像数据集,因为这次的文生图,数据集是基于二次元大数据,所以最终生成的图片都是二次元风格的,如果想要生成别的风格的图片,需要找寻或自己生成数据集。预处理是指,将数据集中的图像,处理成RGB模式(即美术中的三原色,对应三个颜色的不同数值。)

      第三步,前面加载的系统库,通过系统库,对数据进行清洗与过滤,具体过程后面笔记细讲。

      第四步和第五步,模型微调及加载微调后的模型。

      第六步,输入提示词,图片大小的要求,执行次数,最终生成图像!

本次使用通义千问来解读代码

第二部分:代码解读

使用通义千问,给出提示词:“你是一个优秀的python开发工程师,现在我们需要你帮我们分析这个代码的主体框架,你需要把代码按照工作流分成几部分,用中文回答我的问题。{输入所有代码}

输出分析结果,与老师的分析结果一样:

那么同样,我们可以通过通义千问,得到代码的详细解读。在此就不在一一展示。

第三部分:利用通义千问生成所需图片的提示词

eg. 洞房花烛夜的少妇形象。

给通义千问的提示词:“

而我的提示词整理如下:

图片编号场景描述正向提示词反向提示词生成图片问题
图片1女主是一个古代主母,洞房花烛夜古风,工笔画,一个身穿红色华丽嫁衣的女子,坐在装饰精美的洞房内,洞房花烛夜,羞涩低头微笑,上半身特写,手中轻握红盖头。丑陋、变形、嘈杂、模糊、低对比度并没有低头微笑,而是直视前方微笑
图片2管家面无表情的阻止女主进入院子古风,淡墨画,一个身着青衫的中年男子,正面姿势对着我们,站在院门口,面无表情地伸手阻拦状,全身站立姿势,院子内树木葱郁。丑陋、变形、嘈杂、模糊、低对比度,背面姿势、侧面姿势就是不生成正面姿势的图片,就是给我背面或者侧面姿势!
图片3管家恭谨的和老爷说话古风,细致线条勾勒,一个身着青衫的中年男子,低头恭敬地与一位身穿锦袍的轻年男性者对话,青年男性端坐于太师椅上看不清面容,室内摆放着精致的家具,两人处于室内,上半身特写。丑陋、变形、嘈杂、模糊、低对比度,色情擦边希望生成重点是管家,但青年才是重点……
图片4管家威严的吩咐仆役们做事古风,水墨渲染,一个身着青色明制服饰的中年男子,站在院子里,威严地向一群仆役下达指令,仆役们围绕着男子,院子宽阔,周围有亭台楼阁,管家全身站立姿势。丑陋、变形、嘈杂、模糊、低对比度,和仆役背对背,扭曲的手指,多余的手指服装不对
图片5管家被你抓住把柄,非常生气古风,工笔画,一个身着青色明代服饰的中年挽发男子,满脸怒容,手指紧握,似乎被人抓住了把柄,与另一位明代服饰的年轻女性对峙,背景为一处幽静的庭院,管家全身站立姿势。仅两个人物。丑陋、变形、嘈杂、模糊、低对比度、非古代人物马马虎虎,但微调不出我想要的感觉
图片6管家不情愿地给了你钥匙古风,细腻工笔,一个身着青衫的中年挽发男子,面露不悦之色,勉强地将一把铜制钥匙递给另一位古装长袍的女性,两人站在一处幽静的走廊下,管家上半身特写。丑陋、变形、嘈杂、模糊、低对比度这张暂无问题
图片7管家带人追赶女主古风,动感线条,一个身着青色明代服饰的中年男子,愤怒地带领数名仆役快速追赶前方逃跑的女子,女子身穿蓝色长裙,场景为园林小径,众人全身奔跑姿势。丑陋、变形、嘈杂、模糊、低对比度死活不生成前方被追赶的女性形象……
图片8管家看着起火的地宅邸,崩溃古风,细腻工笔,一个身着明代服饰的中年挽发男子,站在熊熊燃烧的大宅前,神情绝望,双手掩面哭泣,背景是烈火冲天的场景,管家全身站立姿势,背部弯曲。丑陋、变形、嘈杂、模糊、低对比度那么大个“双手掩面呢”???好不容易服饰对了,双手掩面再也没有了!!!

生成的图片质量,说实话,不是很符合我的预想,特别是我需要的人物站位和文生图的人物站位,总是有很大差异。好不容易一个点搞定了,另外的如发型服饰等又出问题了。

生成的图片按顺序:

    

    

    

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值