清华多模态大语言模型visualglm部署+微调踩坑记录

1.注意~

本篇文章只是记录遇到的问题和解决方案,非教程!
本篇文章只是记录遇到的问题和解决方案,非教程!
本篇文章只是记录遇到的问题和解决方案,非教程!

ps:
本以为微调visualglm能像chatglm3那样最多碰点版本问题,结果发现小坑不断,得不停查资料,而且大佬们大都去看cogvlm了。o(╥﹏╥)o

2.问题与方案

1.系统影响

系统预测微调
Windows×
Linux

原因:微调需要用到SwissArmyTransformer中的deepspeed。这个包只有Linux可以用,Windows用户别挣扎了~

2.运行webdemo.py报错

我默认大家都是 Hugging Face Hub下载的。因此请用web_demo_hf.py别用web_demo.py,原因后面会讲。
在这里插入图片描述

3.微调坑之权重文件缺失

Hugging Face Hub下载的文件是不含有以下:
mp_rank_00_model_states.pt
latest
model_config.json
这三个文件。正是缺了这些文件,导致web_demo.py跑不了,虽然理论只要一运行那个cli_demo.py文件就会自动下载,但是绝大多少人肯定下载一小部分后就失败。

在这里插入图片描述

在这里插入图片描述
注意那个pt文件非常大大概在14.55G左右,这几个文件我放在以下百度云链接里,使用时只要放到上图对应位置就行

链接:https://pan.baidu.com/s/1yVPN65BXs04D-OXWqp8NCQ?pwd=lmh0
提取码:lmh0
–来自百度网盘超级会员V6的分享

4.微调坑之finetune_visualglm.sh设置修改

必须删了
–layer_range 0 14
这一行,否则运行时,会莫名卡死,原因我不懂~
在这里插入图片描述

4.微调坑之finetune_visualglm.py的补充

添加包

from transformers import AutoTokenizer, AutoModel

因为我的sat生成AutoTokenizer总会报错。我就直接用transformers的AutoTokenizer来替代
然后修改create_dataset_function方法

def create_dataset_function(path, args):
    # tokenizer = get_tokenizer(args)#注释掉该行
    tokenizer = AutoTokenizer.from_pretrained("你的visualglm-6b路径", trust_remote_code=True)
    image_processor = BlipImageEvalProcessor(224)

    dataset = FewShotDataset(path, image_processor, tokenizer, args)
    return dataset

同时由于我的visualglm权重路径是放在其他路径的,由此需要修改一下FineTuneVisualGLMModel的参数

model, args = FineTuneVisualGLMModel.from_pretrained(model_type, args)

改成

model, args = FineTuneVisualGLMModel.from_pretrained(model_type, args,home_path='visualglm-6b文件夹所在路径,比如:  /usr/logs')

5.微调坑之torch缓存

微调运行后在Linux中始终无法开启deepspeed,然后卡死,说torch_extensions/py310******文件占用之类的问题。
解决方法:之家把对应缓冲文件删了,再次运行~ok!!
在这里插入图片描述
这5个坑折磨我一个下午+一晚。难受香菇

PS

2024.01.13补充:
之前找的mp_rank_00_model_states.pt被污染过,难怪怎么微调都不对劲,还是得感谢清华的大佬们,他们提供了原始pt
在这里插入图片描述
原来百度云的里的pt,文件我也换了
在这里插入图片描述
再次感谢清华大佬们~

《大模型技术进化论:多模态模型综述》是一篇系统阐述多模态模型技术进化的综述性论文。多模态模型是指通过整合多种不同的数据形式和类型,构建出更复杂、更完整的模型,以提高模型的表现和性能。 该论文首先介绍了大模型技术的背景和发展动力。随着数据规模的快速增长和多源数据的丰富性,传统的单一模态模型已经面临着一系列的挑战,无法完全适应现实世界中的复杂情况。因此,多模态模型的出现成为了解决这一问题的有效手段。 随后,论文针对多模态模型的构建过程进行了详细的讨论。首先介绍了多模态数据的采集与预处理方法,包括各种传感器和设备的应用,以及数据对齐和归一化等技术。然后,论文详细介绍了多模态特征提取、融合和表示学习方法,包括传统的特征提取算法和深度学习方法等。 接着,论文重点讨论了多模态模型在各个领域的应用。例如,在计算机视觉领域,多模态模型能够通过融合图像和文本数据,实现更准确的图像分类和目标检测。在自然语言处理领域,多模态模型能够通过融合文本和语音数据,实现更准确的情感分析和语音识别。此外,还介绍了多模态模型在医学、金融、推荐系统等领域的应用。 最后,论文总结了多模态模型技术的优势和挑战,并展望了未来的研究方向。多模态模型技术的优势在于可以综合利用不同数据源的信息,提高模型的鲁棒性和泛化能力。然而,多模态模型技术面临着数据集规模和计算复杂度的挑战,需要进一步研究和改进相应的算法和技术。 综上所述,《大模型技术进化论:多模态模型综述》通过系统的介绍了多模态模型技术的构建过程、应用领域和发展前景,对相关研究和应用人员具有重要的参考价值。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值