迁移学习与微调的区别

166 篇文章 17 订阅
本文探讨了迁移学习的概念,将其与微调技术对比,详细解释了如何通过两种方法在新任务中利用预训练模型,包括特征提取和参数调整策略。特别关注了BERT论文中的feature-based方法和fine-tuning的应用实例。
摘要由CSDN通过智能技术生成

一、迁移学习:

1、从字面意义上理解是知识转移的学习方法,指一种学习方法;类比机器学习、深度学习等等概念;
2、把已训练好的模型参数迁移到新的模型来帮助新模型训练

二、微调:

1、从字面意义上理解是小小的调整;指的是一种实现技术或者工具
2、对训练好的模型的参数进行小小的调整;

三、迁移学习与微调的关系

在迁移学习过程中,直接拿来在新场景中使用,取得更优的效果,是需要作相应的处理,而微调是实现迁移学习中的一种工具;处理主要分为两类:

1、Extract Feature Vector:bert论文中(亦称feature-based)先计算出预训练模型对所有训练和测试数据的特征向量,然后抛开预训练模型,然后基于已经提取出来的特征向量设计新的分类模型
2、fine-tune:对预训练模型作些小小的调整;预训练模型可以作为新场景下的训练初始参数,也可以冻结部分层,其他参数可以在训练中进行改变;也可以为预训练模型增加一个全连接层,在训练过程中,仅仅更新新层参数

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值