大模型ai实训营笔记(4)

part1
创建项目,选择B1.medium规格服务器
选择CUDA12.1 PyTorch2.1.1的镜像
在模型中搜索Qwen2-0.5B-Instruct
点击启动后,进入环境。
在/gemini/code中存放代码,/gemini/pretrain中是我们刚刚挂载的模型

我们在本地解压大模型应用.zip,得到5个文件,进入/gemini/code目录,将文件拖入窗口完成上传
part2
不选B1.small,选B1.medium
镜像和数据集选择完毕之后,点击 “立即启动”
进入环境后在网页终端输入以下命令:
tar xf /gemini/data-1/stable-diffusion-webui.tar -C /gemini/code/
chmod +x /root/miniconda3/lib/python3.10/site-packages/gradio/frpc_linux_amd64_v0.2
cd /stable-diffusion-webui && python launch.py --deepdanbooru --share --xformers --listen
开设端口7860,端口用途随便
1.Stable Diffusion图像生成方法

1)概述:一种基于深度学习的文本到图像的生成模型

(1)主要组成部分:
文本编码器:将文本输入转化为向量表示,便于模型理解和生成图像
图像解码器:将向量表示转化为图像,生成具有特定风格的图像
噪声预测器:预测图像中的噪音,以便于模型在生成过程中更好地控制图像的质量和细节
2)模型优势

(1)模型稳定性:在训练过程中表现较高的稳定性,不易出现崩溃或异常现象
(2)训练速度:能够快速生成高质量图像
(3)易于优化和多样性控制
优化方法:采用高效的优化方法,使模型在训练过程中能够快速收敛,提高模型生成效果
多样性控制:通过控制模型参数,实现对模型的多样性控制,使模型能够生成的用户图像
参数调整:提供丰富的参数调整选项,用户可以根据自己的需求调整模型的参数,从而实现对生成图像的个性化控制
3)模型缺点

(1)样本多样性牺牲:模型训练数据不足;模型参数设置不当;模型结构设计问题
(2)生成样本速度问题:模型训练时间和模型推理时间过大,对硬件要求高
4)应用前景

(1)创意性与多样性拓展
创意性拓展:生成各种创意性图像,如艺术作品,产品设计,为创意产业提供新的可能
多样性拓展:生成各种类型的图像,如风景,人物,动物,满足不同领域需求
(2)未来发展趋势与潜力:将推动图像生成技术发展,广泛应用于人工智能应用,促进创意产业发展

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值