最近在研究VLM模型,无意间发现了智谱23年12月发布的CogAgent模型[论文链接],测了一下官方的网页demo,发现确实很好用,于是乎决定自己在云端服务器上部署一下,这篇文章总结我在私有化部署中遇到的一些小问题。
目录
Github官方项目
如何在云服务器中安装LFS
INT4量化加载报错
多卡分布式推理
Github官方项目
项目中有给出非常详细的项目部署的中英文文,也可以查看智谱的官方文档。但是在实际部署中仍然会存在一些小问题。
![](https://img-blog.csdnimg.cn/direct/83b5ddaf2b8744a8a81ef486bbe19f01.png)
如何在云服务器中安装LFS
由于要从hf上远程克隆约40G的模型权重,因此需要安装lfs命令。官方文档中有lfs的安装教程