第2-4章笔记

第2章

通过这章的课程,了解了大模型的基本运行和部署方法,大模型排除各种复杂的训练部分,本身的的应用步骤可以很简单的概括,无论是基础作业还是进阶作业,步骤都可以说是准备环境,git拉取代码,然后用命令运行即可,进阶中的操作也只是为了准备运行所需的条件。

不过本身也和训练营已经打包好的环境包有关系,让部署环境能够一键完成。

第3章

体验了茴香豆应用,主要的优点是能放入各类形式的文件,我本身尝试部署类rag应用时单是放入pdf类文件就挺麻烦的,能将ppt,doc一些文件自己构建向量数据库其实是一个麻烦的事。

说回rag本身,rag和微调的区别个人感觉就是使用向量数据库来替代需要时间的训练成果,好处自然事训练成本大幅降低,微调训练出错了可能还要回档备份,向量数据库这种就没这个必要,不过导入文件过多,每次都要检索费的时间(从茴香豆使用体验)看来可能比较长,这可能是一个问题,当然降低训练门槛是好事。

第4章

微调了模型自我认知,尝试了次数,如果过多训练次数会导致模型呆呆的,基本只会回答你微调时的的语句。

看了一下X_tuner的具体流程,具体与微调相关的分为两点,前期准备包括数据集的采集,模型选择和确定微调方式,然后再X_tuner的配置库进行调整以达到自己想要的微调方向,数据集的生成十分简单,重要的是数据集质量,像课程里只用几句话的数据集最多可以给模型玩玩角色扮演。

微调容易出现过拟合情况,一般需要增加权重文件上下或者降低训练内容的占比。

模型微调的成果可通过转换储存成Lora模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值