我自己从课本按照格式提取8k条数据,但是训练时,sft的loss值平均在2以上,评估指标bleu-4只有20%左右,而且epoch增加评估指标还会越低。我的数据集部分如下图所示,有没有遇到相同问题的,参数应该没啥错。因为我微调自带的数据集都没啥问题所以我感觉是自己数据质量低导致,具体也不知什么原因,希望有佬指点迷津,感谢!
LLAMA-factory 自制数据质量低怎么办?
于 2024-07-10 17:52:35 首次发布
我自己从课本按照格式提取8k条数据,但是训练时,sft的loss值平均在2以上,评估指标bleu-4只有20%左右,而且epoch增加评估指标还会越低。我的数据集部分如下图所示,有没有遇到相同问题的,参数应该没啥错。因为我微调自带的数据集都没啥问题所以我感觉是自己数据质量低导致,具体也不知什么原因,希望有佬指点迷津,感谢!