weixin_73891211-CSDN博客

原创 GUET SAI 2021高级工程实训第一周任务baseline

model.py文件:其中包含了数据读取和预处理, 模型构建, 训练和测试模块,建议在实际使用时将这几个模块分开在多个.py文件中,增强项目可读性和可修改性.同时也是抛砖引玉,鼓励同学们积极分享自己在本赛题上的心得体会.以下是对原始文件的解释以及详细代码.pre.py文件:制作出基本的提交文件的模板(原始的submission_example文件仅有十行,只是用于参考文件的提交格式)不过一开始也说了, 本帖仅供参考, 不建议将本文的结果作为最终结果提交(应该也没人想交个零分上去吧/doge)

2024-07-01 15:23:18 562 1

原创在autoDL的服务器上部署Qwen-7B-Int4并进行微调(用于记录)

可以看见,模型不能很好地理解我们的要求,会出现幻觉.此处由于使用的7B参数的模型,幻觉不明显.实测如果使用1.8B参数模型,会产生答非所问的现象.因此,我们生成大量样例去训练模型,让他学会按我们的要求去分析问题.安装好库以后,开始下载Qwen-7B-Chat-Int4模型到本地并部署。建议拉取到本地,上传至阿里云盘后再拉进autoDL的实例,具体过程参照。观察输出可以发现大模型已经可以稳定地按照我们的要求去分析问题,微调成功。进行的学习,若您认为本文有侵权行为,请联系我进行修改或删除。

2024-06-18 20:14:36 451

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 GUET SAI 2021高级工程实训第一周任务baseline

原创 在autoDL的服务器上部署Qwen-7B-Int4并进行微调(用于记录)

空空如也

空空如也

原创在autoDL的服务器上部署Qwen-7B-Int4并进行微调(用于记录)