第一次记录,多多包涵
1.环境配置,这里的pytorch环境最好是直接下包,不然后面会出现各种各样的错误
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"
2.模型,这里我用的是Qwen/Qwen2-VL-2B-Instruct,可以做多模态的模型,可以直接在魔塔社区下载,也可以在hugging face下载。
3.显卡,这里我用的是我们学校的一个3090的服务器,可以使用这个指令上传文件到服务器
scp -r "your_data_path" aaa.000.000.00.00:~/wwz
4.数据集,这里我要跑的是一个其他项目的数据集,那个项目使用的是mplug-owl2模型,我把他的一部分数据集下载下来,并对其进行数据处理。
这个图片数据集本身是有12000多张图片,但是我只下载了他的train.json,所以要根据train.json里对每张图片的描述,对这个图片数据集进行处理,保留只在