OpenMMLab AI实战营 课程笔记2

视觉任务的难点是像素整体呈现出的结果和个别像素的值没有直接关联,难以遵循具体的规则设计算法。

保留边缘轮廓的一些信息,应用于图像分类。

不仅学习分类,还学习如何产生合适分类的特征。深度学习的思想。

课程内容:

1、函数如何设计

2、如何求解一个好的参数,达到好的效果

开端。AlexNet

VGG将5*5拆解成3*3。更少的参数。

配合边界填充保持分辨率。卷几层后进行一次降采样。

GoogleNet参数量大大减少。

人们逐渐发现精度退化问题

基于此思想,提出来残差学习

计算技巧:残差模块加了一层,计算量更小。

1.ResNet是深浅模型的集成

2.残差链接让损失曲面更平滑

3.ResNet后续改进

范式未改变,精度有提高。

图像分类&视觉基础模型发展

轻量化卷积神经网络

多个多通道

降低模型参数量和计算量的方法

例如:

真正轻量化——可分离卷积

介于可分离卷积和一般卷积中间还有分组卷积

Vision Transformers

自然语言领域发家,后引入图像领域

之前卷积里特征是常数,注意力机制中特征是输入的函数。

模型学习

监督学习

基于梯度下降训练神经网络的整体流程

初始化参数,从数据集中采集一个batch(无放回采样),数据处理(增强等)得到四维数组,前传计算损失,反传计算参数梯度,梯度下降更新参数,用优化器增加一些策略技巧

学习率与优化策略

是一个经验结论。

数据增强

像素级别/2

自监督学习

自监督学习:基于无标注的数据学习

基于代理任务

基于对比学习

基于掩码学习

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值