SMP 2023金融大模型挑战赛实践优化调试分享(三)
众所周知,调试是在开发过程中以及在项目投入使用前必不可少的阶段,甚至有80%的0时间我们都在进行这一步骤,以此找出错误原因和具体位置,然后修正代码,最终呈现出最符合自己理想的设计。下面是我这两天在调试代码中得到的经验:
一、大概思路:
1、抽取部分输出样本进行数据标注
2、将样本debug,找出错误原因并归类
3、修改代码,逐个解决每类问题
二、详细步骤:
(一)抽取部分输出样本进行数据标注
资料给了5000个左右的问题,其中包括初级问题、中级问题和高级问题。我从初级问题中抽取了50个进行数据标注。为了思路清晰我列了个表,表头包括:id、文本、输出答案、答案是否正确、修改后的答案以及可能出错的原因。其中,修改后的答案是我人为查找并记录在表格里的,没有对文件进行操作。
(二)将样本debug,找出错误原因并归类
这里需要写一个debug程序,目的是在运行这个程序的时候能把中间的步骤输出出来(就是在主代码的基础上改编一下)。我通过这个程序将每个回答有错误的问题依次运行,找出错误原因(查看它是从哪里得到答案),并把错误原因归类。我大致分为了以下六种情况:
1、数据库中没这年的数据(资源文件中有)&