第二课堂,AI实践第四次笔记

大模型原理与应用

大模型概念

核心是注意力机制,通过注意力机制,聚焦于输入序列中的重要部分,类似于人类阅读时关注关键词。

大模型特点

规模巨大,预训练和微调机制,上下文感知能力

以Qwen为例

part1
创建项目,选择B1.medium规格服务器
在这里插入图片描述
选择CUDA12.1 PyTorch2.1.1的镜像
在这里插入图片描述
在模型中搜索Qwen2-0.5B-Instruct
点击启动后,进入环境。
在/gemini/code中存放代码,/gemini/pretrain中是我们刚刚挂载的模型
在本地解压大模型应用.zip,得到5个文件,进入/gemini/code目录,将文件拖入窗口完成上传

tokenizer:导入的模型库
system:前提条件
user:用户方面提出的问题
assitant:希望大模型输出的话
model_inputs:数字化

stable diffusion图像生成方法

组成部分

文本编码器,图像解码器,噪声预测器

part2

创建项目,选择B1.medium规格服务器
镜像搜1111
数据搜stable diffusion model
进入环境后在网页终端输入以下命令:
tar xf /gemini/data-1/stable-diffusion-webui.tar -C /gemini/code/
chmod +x /root/miniconda3/lib/python3.10/site-packages/gradio/frpc_linux_amd64_v0.2
cd /stable-diffusion-webui && python launch.py --deepdanbooru --share --xformers --listen
按照生成的链接创建端口,复制进入环境

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值