不同数据集下使用微调 数据量相似度微调方向少高修改最后几层或最终的softmax层少低冻结预训练模型的初始层大低重新训练大高原有模型基础上所有权重更新 微调的方式 换数据源针对K层重新训练K层的权重和shape调整