DataWhale 五一llama3超级课堂学习报告

文档学习链接 :https://github.com/SmartFlowAI/Llama3-Tutorial

环境配置

根据教程完成开发机远程环境配置,不嫌麻烦可以不配置ssh,一直密码链接。

注意InternStudio的配置环境是有200g的云存储空间在/root下。

本地DEMO部署

根据引导一步步装下去就可以了。开发机的/share已经存好了需要的数据。

远程服务器在本地打不开可能是vscode的端口转发配置错误,直接把端口设置为(默认8501),然后访问localhost:8501就好。

成功在web端部署

微调个人小助手认知

数据集里面只有两句话,所以微调出来只会重复两句话。
一共微调672个iter,跑起来loss下降还是挺快的。
500 iter的时候保存了一次checkpoint。

跑到最后一步遭遇报错

raise OSError(errno.ENOSPC, "inotify watch limit reached")
OSError: [Errno 28] inotify watch limit reached

在 Linux 系统中,当 inotify 实例的数量超过了系统限制时就会出现这个问题。inotify 是 Linux 内核的一个特性,用于监控文件系统的变化,而 Streamlit 使用它来监控文件的变化以自动刷新应用。

然后还没有sudo权限 这个不好解决了啊,重启?总之临时增加了inotify的限制之后能动了。

在这里插入图片描述

只会回复这一句了

LMDeploy部署

安装好lmdeploy,获取模型权重后,可以直接调用chat,在终端聊天。

在这里插入图片描述

好简陋 全是token

模型量化

可以缩小kv cache 大小(代价是降低推理速度)

W4A16量化(4-bit weight, 16-bit activation))

  • 不知道为什么需要下载远程代码下的很慢,好像可以trust-remote-code来解决
  • 竟然还有训练测试验证集
  • 每层要3-4g显存 分开练的,可以并行吗
  • 调模型要在后缀加上-model_weight awq
    lmddpoly支持在线量化kv int4/int8两种精度
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值