weixin_46873533-CSDN博客

原创第七章、OpenCompass 大模型评测实战--作业

通过OpenCompass平台的综合评测，可以全面地衡量和比较大模型在各种任务和场景下的性能，支持模型发展的各个方面，从性能测试到实用部署。

2024-04-24 23:57:18 258

原创 OpenCompass---大模型的评测

详细的客观评测指引参见支持新数据集 — OpenCompass 0.2.4 文档由于客观评测只能反映模型在一些性能数据上的指标，没法完全真实地反映模型在与人类对话时的表现，因此需要在真实的对话场景下通过主观评测的方式翻译模型的真实性能。而由于完全靠人力来进行主观评测是费时费力的，因此有很多利用模型来进行主观评测的方式。这些方式主要可以分为以下几类：打分，对战，多模型评测等。

2024-04-24 23:07:28 969

与 1.2 部分类似，我们在两个 terminal 中分别启动 LMDeploy 服务和 Tutorial 已经写好的用于这部分的 Web Demo：Important注意，确保 1.1 节中的 LMDeploy 服务以及 1.2 节中的 Web Demo 服务已经停止（即 terminal 已关闭），否则会出现 CUDA Out of Memory 或是端口已占用的情况！export WEATHER_API_KEY=在2.2节获取的API KEY。

2024-04-23 19:46:13 546

原创第六节：Lagent & AgentLego 智能体应用搭建--学习笔记

与 1.2 部分类似，我们在两个 terminal 中分别启动 LMDeploy 服务和 Tutorial 已经写好的用于这部分的 Web Demo：Important注意，确保 1.1 节中的 LMDeploy 服务以及 1.2 节中的 Web Demo 服务已经停止（即 terminal 已关闭），否则会出现 CUDA Out of Memory 或是端口已占用的情况！export WEATHER_API_KEY=在2.2节获取的API KEY。

2024-04-23 19:37:25 950

原创第 4 节课作业-XTuner 微调个人小助手认知

通过折叠部分的修改，内容如下，可以直接将以下代码复制到。

2024-04-22 21:41:50 1110

原创书生·浦语训练营第四讲-Xtuner微调学习笔记

根据项目目标使用环境进行模型选型，如果业务场景需求比较复杂就需要进行模型微调，根据算力是否充足可以选择模型的全参数微调或部分参数微调。的模型参数，固定大部分预训练模型参数，从而大大降低了计算和存储成本，同时能实现与全量参数微调相当的性能，甚至在某些情况下效果更好。微调是一个将预训练模型在较小、特定数据集上进一步训练的过程，目的是精炼模型的能力，提高其在特定任务或领域上的性能。Settings：涵盖模型的基本设置，包括预训练模型的选择、数据集信息以及训练过程的一些参数。

2024-04-21 21:47:03 740

weixin_46873533的博客

原创第七章、OpenCompass 大模型评测实战--作业

原创 OpenCompass---大模型的评测

原创第六节：Lagent&AgentLego作业并上传截图

原创第六节：Lagent & AgentLego 智能体应用搭建--学习笔记

原创第 4 节课作业-XTuner 微调个人小助手认知

原创书生·浦语训练营第四讲-Xtuner微调学习笔记

空空如也

空空如也

原创 第七章、OpenCompass 大模型评测实战--作业

原创 OpenCompass---大模型的评测

原创 第六节：Lagent&AgentLego作业并上传截图

原创 第六节：Lagent & AgentLego 智能体应用搭建--学习笔记

原创 第 4 节课作业-XTuner 微调个人小助手认知

原创 书生·浦语训练营 第四讲-Xtuner微调学习笔记

空空如也

空空如也

原创第七章、OpenCompass 大模型评测实战--作业

原创第六节：Lagent&AgentLego作业并上传截图

原创第六节：Lagent & AgentLego 智能体应用搭建--学习笔记

原创第 4 节课作业-XTuner 微调个人小助手认知

原创书生·浦语训练营第四讲-Xtuner微调学习笔记