MMLAB-AI训练营笔记——Day2

图像分类是识别图片中物体的任务,涉及数据收集、模型定义、训练和预测。传统的图像特征设计已由深度学习取代,如AlexNet、VGG-19和GoogLeNet等网络结构,利用卷积和多头注意力进行特征提取。深度学习模型通过监督和自监督学习来优化。
摘要由CSDN通过智能技术生成

1. 图像分类

  • 任务目标:给定一张图片,识别图片中的物体是什么;
  • 数学表示:图像X属于R(H,W, 3),类别为1,2,3,。。,K。从X映射到{K}
  • 步骤:1.收集数据,2.定义模型,3.训练,4.预测
  • 机器学习的局限:机器学习善于处理低维、分布相对简单的数据
  • 传统方法(设计图像特征):图像通过人工设计的方法变为特征向量,经过机器学习进行分类
  • 使用深度学习:学习如何产生适合分类的特征
  • 层次化特征的实现方式:卷积实现一步特征提取;多头注意力实现一步特征提取
  • 课程内容:1.模型设计:设计适合图像的函数;2.模型学习:监督学习和自监督学习

2.图像分类

  • AlexNet: 5个卷积层,3个全连接层,共有60M个可学习的参数
    使用和ReLU函数;实现并开源了CUDA并行运算
  • VGG-19;
  • VGG(2014):网络层数11,13,16,19;3by3卷积配合1像素的边界填充;
  • GoogLeNet
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值