【课程笔记-李宏毅ML】transfer learning

在这里插入图片描述

模型微调

目标领域的数据较少,例如在语音识别领域,可以通过source data来训练一个模型,然后使用target data的数据进行参数微调。
需要注意target data很少,容易过拟合

conservative training

在这里插入图片描述
用source data训练的模型参数来初始化target data的模型,然后用target data的数据进行微调(GD的时候只更新几个epoch),但是由于target data的数据比较少,就很容易发生过拟合的问题。
有一些措施来避免这些问题:1.令两个模型的输出比较接近
2.用target data的模型参数做正则化,令两个模型的参数比较接近
3.在训练时进行一些限制,如在参数微调时,只微调某些参数(如下)
在这里插入图片描述
有一个问题:应该调哪些参数呢?
语音方面:往往只调第一层的参数(或者是比较接近input的layer的参数。为啥:不同人说话有所不同,但当神经网络将其进行初步解析之后,后面的识别应该大致相同,故通常的做法时只调节靠近input层的参数)
影像方面:往往固定靠近input的layer的参数,调节后面的参数(因为在影响方面前几层侦测的往往是比较基本的特征,如线条或简单图案等,这些基本的几何特征对于不同的task可以是通用的,所以一般在影像方面通常固定前几层,只微调后面测参数)
一个例子:

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
李宏毅ML2021春季课程的第三个作业是一个关于自然语言处理任务的实践项目。这个作业涵盖了文本分类、情感分析和命名实体识别等主题。 学生们的任务是使用提供的数据集,通过实现机器学习算法,对文本进行分类和情感分析。对于命名实体识别,学生们需要利用已有的工具和技术来提取文本的实体,例如人名、地名、组织名等。 在这个作业,学生们需要掌握一些基本的自然语言处理技术和算法。他们需要了解常用的特征提取方法,例如词袋模型和TF-IDF。此外,学生们还需要学习基本的分类算法,如朴素贝叶斯和支持向量机。在情感分析任务,学生们需要了解情感词典和情感分析的基本原理。 此外,学生们还需要使用Python编程语言和相关的自然语言处理工具库,如NLTK和SpaCy。通过实践项目,学生们将获得与自然语言处理相关的实际经验,并加深对机器学习模型和算法的理解。 完成这个作业需要一定的时间和努力。学生们需要仔细阅读作业要求和相关文档,并按照要求完成代码实现和实验报告。他们还需要参考课程讲义和推荐的学习资源,以加深对自然语言处理领域的理解。 总的来说,李宏毅ML2021春季课程的HW3是一个涉及自然语言处理任务的实践作业。通过完成这个作业,学生们将掌握基本的自然语言处理技术和算法,并获得与自然语言处理相关的实际经验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值