本项目为Datawhale 举办的的“免费GPU线上跑AI项目实践”项目的个人笔记。
具体内容详见:用免费GPU线上跑AI项目实践
本文主要针对项目教程,给出可能会出现的报错与解决方式
项目简单介绍
本次项目在趋动云平台部署了三个AI项目实践,实践内容如下:
•
用免费GPU线上优化猫狗识别实践
•
用免费GPU创建属于自己的聊天GPT
•
用免费GPU部署自己的stable-diffusion
一.部署ChatGLM3-6B模型
1.安装依赖报transformers错误
解决方案:加入清华源
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple requests
2.卡在100%,访问外部网址失败
解决方案:换更大的实例规格,如切换为B1.large
3.访问外部网址失败(来自他人反馈)
可能的解决方案:
①换用浏览器,如edge浏览器换用谷歌
②链接是 “外部访问:*******************”!!!!千万别搞错了
4.gradio转换streamlit转换需要ctrl+c杀掉进程,但存在一定延迟,注意观测右侧虚拟GPU显存
二.线上优化猫狗识别实践
1.训练卡死
解决方案:换更大的实例规格,切换为B1.2xlarge
三.部署stable-diffusion
1.文件不存在
解决方案:由于数据集的更改导致的报错,但不影响最后的部署,可以不必理会
最后的话
官方教程很详细,只要跟着教程走,基本不会有太大的问题!
后续可能存在的问题我会及时更新
引用一句话