讯飞大模型微调(Datawhale 夏令营)
整体流程基本可观:
一、数据处理
二、微调模型
三、预测评估
感觉目前平台还是比较粗糙,很多地方不完善。训练状态完全不可控,调参太不方便了,
目前大模型微调主要是数据处理阶段,在 baseline 中也有体现,待后续精度。
#Datawhale 夏令营
讯飞大模型微调(Datawhale 夏令营)
整体流程基本可观:
一、数据处理
二、微调模型
三、预测评估
感觉目前平台还是比较粗糙,很多地方不完善。训练状态完全不可控,调参太不方便了,
目前大模型微调主要是数据处理阶段,在 baseline 中也有体现,待后续精度。
#Datawhale 夏令营