- 博客(5)
- 收藏
- 关注
原创 @Datawhale X 魔塔 AI夏令营 从零入门AI生图原理&实践 task3笔记
GUI 是 "Graphical User Interface"(图形用户界面)的缩写。也就是电脑屏幕上看到的各种图标和按键等等。而ComfyUI是GUI的一种,其是基于节点工作的用户界面,主要用于操作图像的生成技术,ComfyUI 的特别之处在于它采用了一种模块化的设计,把图像生成的过程分解成了许多小的步骤,每个步骤都是一个节点。这些节点可以连接起来形成一个工作流程,这样用户就可以根据需要定制自己的图像生成过程。
2024-08-17 19:28:20 831
原创 @Datawhale AI夏令营第四期 从零入门AI生图原理&实践 task2笔记
对于通义千问的能力:!通过task2的学习了解,我知道了一些与AI生图有关的知识,知道了AI生图的大致历史。同时我对于baseline代码也有了进一步的了解,知道了其各代码段的作用。我还学会了如何利用AI大模型来辅助我们的相关学习。对于最终的生成结果我认为大体上还是满意的,但还是有一些不足的地方,比如:模型对于我的描述的实现还是不够准确,有几张图片并不是完全的二次元风格,同时第二张图片的挥舞旗帜呈现的也还是不够好,这还需要我进一步的学习更多的模型微调方法以及如何更好的进行提示词工程。
2024-08-13 23:19:00 595
原创 @Datawhale AI夏令营第四期 从零入门AI生图原理&实践 task1笔记
赛事任务:参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格......基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性样例:偶像少女养成日记:数据集要求:我们可以用官方提供的数据集也可以自己寻找所需的数据集task1总体跑的还是比较顺利的,除了遇到一次提示服务器超时以外没有遇到其它大的问题。这是我第一次体验通过代码来实现AI生图体验还是很不一样的。
2024-08-11 09:21:41 466
原创 @Datawhale 夏令营第三期 从零入门AI逻辑推理 task3 笔记打卡
task3的整体运行过程还是比较顺利的,遇到的一些问题也在交流群中找到了答案;通过使用task3的微调优化方案,最终输出结果相比之前也有了较高的提升;但仍有所欠缺的是我对于一整个调参优化的过程还是没有完全理解。对于其它的优化方案的思考与探索也还需更进一步。
2024-08-03 00:25:09 265
原创 @Datawhale 夏令营第三期 从零入门AI逻辑推理 task1 笔记打卡
try:else:raise# 这里采用dashscope的api调用模型推理,通过http传输的json封装返回结果else:))# 这里定义了prompt推理模版prompt = f"""你是一个逻辑推理专家,擅长解决逻辑推理问题。以下是一个逻辑推理的题目,形式为单项选择题。所有的问题都是(close-world assumption)闭世界假设,即未观测事实都为假。请逐步分析问题并在最后一行输出答案,最后一行的格式为"答案是:A"。题目如下:### 题目:{problem}
2024-07-28 16:22:19 599
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人