大语言模型
文章平均质量分 90
Large Language Models
三千越甲可吞吴、
知不可乎骤得 托遗响于悲风
展开
-
利用tree-sitter提取代码文件中的函数和注释
提取.c或.cpp文件中的带有注释的函数,作为训练数据喂给大语言模型。要求是能够批量处理,提取函数前带有注释的函数和注释,并将函数中的注释同样提取出来作为辅助训练数据,结果保存在JSON文件中。如何将conda的虚拟python环境添加到pycharm中见。原创 2024-04-25 18:50:37 · 447 阅读 · 0 评论 -
大语言模型开发各个阶段的评估方法
思考:第一次接触这个问题的时候,我想到的对大语言模型的评价是针对专用模型的评价,在公用的开源数据集或者基准上计算评价指标的得分,如果得分高则意味着大语言模型性能好。场景:我们要设计一个专有领域的大语言模型,设计思路是先选择开源的基座模型,使用领域相关的数据集对基座模型进行微调得到通用的大语言模型,再使用特定任务的数据集进一步对基座模型进行微调得到专用的大语言模型。根据我们设计领域特定大语言模型的思路,对大语言模型开发过程的评估主要有两个方面,一个是数据的评估,一个是模型的评估。原创 2024-04-02 23:53:39 · 581 阅读 · 0 评论