第2-4章笔记

shdjmouyu

于 2024-05-12 14:06:52 发布

阅读量114

点赞数 1

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shdjmouyu/article/details/138750074

版权

第2章

通过这章的课程，了解了大模型的基本运行和部署方法，大模型排除各种复杂的训练部分，本身的的应用步骤可以很简单的概括，无论是基础作业还是进阶作业，步骤都可以说是准备环境，git拉取代码，然后用命令运行即可，进阶中的操作也只是为了准备运行所需的条件。

不过本身也和训练营已经打包好的环境包有关系，让部署环境能够一键完成。

第3章

体验了茴香豆应用，主要的优点是能放入各类形式的文件，我本身尝试部署类rag应用时单是放入pdf类文件就挺麻烦的，能将ppt,doc一些文件自己构建向量数据库其实是一个麻烦的事。

说回rag本身，rag和微调的区别个人感觉就是使用向量数据库来替代需要时间的训练成果，好处自然事训练成本大幅降低，微调训练出错了可能还要回档备份，向量数据库这种就没这个必要，不过导入文件过多，每次都要检索费的时间（从茴香豆使用体验）看来可能比较长，这可能是一个问题，当然降低训练门槛是好事。

第4章

微调了模型自我认知，尝试了次数，如果过多训练次数会导致模型呆呆的，基本只会回答你微调时的的语句。

看了一下X_tuner的具体流程，具体与微调相关的分为两点，前期准备包括数据集的采集，模型选择和确定微调方式，然后再X_tuner的配置库进行调整以达到自己想要的微调方向，数据集的生成十分简单，重要的是数据集质量，像课程里只用几句话的数据集最多可以给模型玩玩角色扮演。

微调容易出现过拟合情况，一般需要增加权重文件上下或者降低训练内容的占比。

模型微调的成果可通过转换储存成Lora模型

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。