系统评估和优化

最新推荐文章于 2024-10-18 00:00:00 发布

CharlesChenMS

最新推荐文章于 2024-10-18 00:00:00 发布

阅读量186

点赞数 2

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cms90822/article/details/140045240

版权

1、评估LLM应用

对于LLM应用的评估和优化传统思路就是：初期在小样本集上开展验证，人工设计的评估标准对构建的prompt进行打分，收集bad case并进一步对prompt进行优化；等prompt稳定后，在大批量数据集上再构建自动化的评估流程。

2、大模型的评估方法

里面比较独特的就是大模型评估，因为需要一个能力比被评估模型更强的模型来执行。

3、优化生成方法

这部分主体就是将大模型直接回答一个问题拆分成细分步骤，这样的话可以减少prompt里各种语义耦合增加的难度。

4、优化检索方法

这部分就是对知识库的检索进行优化，包括优化query和知识库里的向量，以及两者之间的匹配方法。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。