第四届微调——炼丹

学习地址:Tutorial/xtuner/README.md at main · InternLM/Tutorial · GitHub

笔记

微调是一种在已有的预训练模型基础上,通过使用新的数据对模型进行进一步优化和调整的技术手段。它的目的是使模型能够更好地适应特定的应用场景和任务需求,进一步提高模型在特定领域或任务中的性能,包括准确性、泛化能力和适应性等。

微调的方式

  1. 增量预训练微调:在原预训练模型的基础上,继续进行预训练,同时结合新的数据进行微调,以增强模型对特定领域的理解和表现
  2. 指令跟随微调:根据特定的指令或任务要求,对模型进行针对性的微调,使模型能够更好地遵循指令并完成相应任务

微调的数据类型

  1. 技术垂类领域数据:与特定技术领域相关的数据,如特定行业的专业知识、术语等,有助于模型在该领域更深入地理解和处理问题
  2. 高质量对话、问答数据:包含丰富的对话和问答信息的数据,有助于模型提升对话和回答的能力与质量
  3. 特定任务数据集:与具体任务相关的数据,如分类任务的分类标签数据、回归任务的数值数据等,可使模型更好地适应特定任务需求
  4. 多模态数据:结合图像、音频等多模态数据进行微调,可使模型具备处理多模态信息的能力

微调的注意事项

  1. 避免过拟合:在微调过程中要注意控制模型的复杂度,避免过度拟合新的数据,导致模型在其他数据上的性能下降
  2. 选择合适的超参数:根据数据和模型特点,合理选择微调的超参数,如学习率、迭代次数等
  3. 监控模型性能:在微调过程中要持续监控模型的性能变化,及时调整微调策略

微调的应用场景

  1. 自然语言处理:在文本分类、情感分析、机器翻译等任务中,通过微调提高模型的性能
  2. 计算机视觉:在图像分类、目标检测、图像分割等任务中,利用微调使模型更好地适应特定场景
  3. 其他领域:如语音识别、推荐系统等领域,也可通过微调提升模型的性能和适应性

记录:

中间创建多次导致出现多个环境错乱

训练好久了学习其他同学的思维导图:

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值