从零入门 AI 逻辑推理Datawhale 2024 年 AI 夏令营 task3

思路:

本次任务是在baseline使用loar微调后,在vllm加速的情况下,进行的逻辑推理。

具体过程:

如图:


 

task3运行路线:魔搭运行gpu选第二个镜像-跑lora(只跑一遍别重复运行cell,提示重启notebook的在文字前面的cell跑完之后点notebook工具栏那个刷新按钮)-跑vllm(在后台挂着)-跑文件夹里面的baseline2 

详细过程:

‌​​‬‍⁠​‍‌​⁠‌⁠‍⁠‍​‍​‌‌​​​​‬‬‌​​​​‌​‍⁠​​​‌​​​​​Task3 baseline02 微调方案 - 飞书云文档 (feishu.cn)

 注意事项:

1.要注意使用gpu以及相应的镜像

2.在跑lora微调代码时,要把文件改为an文件,并且每小段代码只能运行一次,另外,在要求重启notebook时要重启内核。

3.记得导入相关文件,main的主train文件。

4.vllm代码是加速代码,挂在后台即可。

最终成绩:

收获所得:

虽然对代码并未完全掌握,但是学到了一定的解决代码报错的能力,学习到了微调的方法。

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值