多模态大模型的微调初体验- GPT 模型微调实战指南

0x00 前言

图片

在这个基础上, 更有高手通过微调,做出了首个会看胸部X光片的中文多模态医学大模型。恰逢最近看到6b的多模态模型的微调方法开源,于是进行初步的体验,为接下来的深入学习做准备。

图片

0x01 环境准备

硬件配置建议

  • 处理器:推荐使用第 12 代 Intel Core i7 或更高配置
  • 内存:建议 48GB 以上(尽管 16GB 也可以,但加载模型速度较慢)
  • 显卡:显存 24GB 以上(qlora只需要9.8GB显存即可微调。)

部署环境

使用nvidia-docker部署最新的pytorch,切记不要使用真实环境,一旦出现包存在问题,导致回滚会非常浪费时间。

检验: 依次输入以下命令,查看环境是否部署好:

nvidia-smi 查看显卡是否能够正常识别

图片

pytorch 查看显卡是否能够正常识别

图片

0x02 模型准备

训练脚本:https://github.com/THUDM/VisualGLM-6B/tree/main/finetune

模型: https://github.com/THUDM/VisualGLM-6B

使用 pip 安装依赖:pip install -r requirements.txt

等待安装完成后,基本工作就做完了。

0x03 训练数据准备

官方提供了 fewshot-data.zip 的文件,解压后,即可得到20张图片以及1个json

图片

训练的输入如图:img为图片地址, prompt 是问题,label是答案,

图片

确认OK后,执行,看到如下字样后,开始就训练了。

图片

0x04 训练结果

由于是20张图,训练结果非常快,大概几分钟就训练好了,回答效果如下

图片

感觉非常惊人,这是训练前的结果:

图片

于是我有拿起了视觉模型常见的安全挑战项目,验证码识别。

图片

但是可惜这次效果比较一般,虽然它已经知道我是识别验证码,但是识别的能力很弱,甚至是全部都只能回答出来 3cnp8。

图片

又试了一下打思想钢印, 废了好一阵子,还没打上 - - 。

图片

0x05 思考

  1. 短短几个月的微调使得模型从单一的文本模型转变为了多模态模型,并且表现出不俗的效果能力。

  2. 在这次微调过程中,一些最新的技术直接引入,比如微软的DeepSpeed和Qlora,未来,可能个人训练一个拥有65B参数的模型也不是不可能。

  3. 教程和代码发布的时间不久,我们还有很多数据和方法需要尝试。本文只是初步尝试的结果,待模型经过更深层次的训练后我们将会分享更多成果。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值