【VisualGLM】大模型之 VisualGLM 部署

目录

1. VisualGLM 效果展示

2. VisualGLM 介绍

3. VisualGLM 部署


1. VisualGLM 效果展示

  • VisualGLM 问答

 

  • 原始图片

 

2. VisualGLM 介绍

VisualGLM 主要做的是通过图像生成文字,而 Stable Diffusion 是通过文字生成图像。

 

一种方法是将图像当作一种特殊的语言进行预训练,还有一种是将图像特征对齐到预训练语言模型,可充分利用语言模型,并且无缝衔接多轮对话能力,但提取图像语义特征会损失底层信息。

 

VisualGLM 模型架构是 ViT + QFormer + ChatGLM,在预训练阶段对 QFormer 和 ViT LoRA 进行训练,在微调阶段对 QFormer 和 ChatGLM LoRA 进行训练,训练目标是自回归损失(根据图像生成正确的文本)和对比损失(输入 ChatGLM 的视觉特征与对应文本的语义特征对齐)。

3. VisualGLM 部署

  • ChatGLM 模型权重下载见

【ChatGLM】大模型之 ChatGLM 部署

  • VisualGLM 启动
# 源码下载
git clone https://github.com/THUDM/VisualGLM-6B.git

# 代码修改
# 可以把 ChatGLM-6B 改为本地加载

# web 端启动
cd VisualGLM-6B
pip install -r requirements.txt
pytohn web_deme.py

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Encarta1993

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值