复现计划:
- 数据集准备
- 跑通follow工作的前置代码
- 准备一个跑通的训练代码(不管正确性)
- 跑一次训练
- 进一步阅读论文,更正训练代码,迭代
今天目标是完成第三部分,任务有点难,做的过程中可以进一步划分
第三部分做到一半,和mentor聊了,认为我要先找好benchmark和Task之后再关注方法,这样后面的工作进展才能顺利。我觉得很有道理,就在目标方向上搜索了benchmark和数据集,没有想做任务的直接的benchmark,但就找了一些相关的数据集,现在的想法是:
- 利用这些相关的数据集自己做个比较的benchmark(比较的baseline包括传统的最优方法和现在通用大模型在这些数据上的结果)
- 对现有的通用评测的benchmark的数据进行筛选,得到一个和我目标任务强相关的子数据集,然后在这个上面进行比较