MMLAB-AI训练营笔记——Day2

最新推荐文章于 2024-08-21 16:56:45 发布

Bellamy_xxx

最新推荐文章于 2024-08-21 16:56:45 发布

阅读量92

点赞数

文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44992157/article/details/128870146

版权

图像分类是识别图片中物体的任务，涉及数据收集、模型定义、训练和预测。传统的图像特征设计已由深度学习取代，如AlexNet、VGG-19和GoogLeNet等网络结构，利用卷积和多头注意力进行特征提取。深度学习模型通过监督和自监督学习来优化。

摘要由CSDN通过智能技术生成

1. 图像分类

任务目标：给定一张图片，识别图片中的物体是什么；
数学表示：图像X属于R（H，W, 3)，类别为1，2，3，。。，K。从X映射到{K}
步骤：1.收集数据，2.定义模型，3.训练，4.预测
机器学习的局限：机器学习善于处理低维、分布相对简单的数据
传统方法（设计图像特征）：图像通过人工设计的方法变为特征向量，经过机器学习进行分类
使用深度学习：学习如何产生适合分类的特征
层次化特征的实现方式：卷积实现一步特征提取；多头注意力实现一步特征提取
课程内容：1.模型设计：设计适合图像的函数；2.模型学习：监督学习和自监督学习

2.图像分类

AlexNet: 5个卷积层，3个全连接层，共有60M个可学习的参数
使用和ReLU函数；实现并开源了CUDA并行运算
VGG-19；
VGG（2014）：网络层数11，13，16，19；3by3卷积配合1像素的边界填充；
GoogLeNet

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MMLAB-AI训练营笔记——Day2

任务目标：给定一张图片，识别图片中的物体是什么；数学表示：图像X属于R（H，W, 3)，类别为1，2，3，。。，K。从X映射到{K}步骤：1.收集数据，2.定义模型，3.训练，4.预测机器学习的局限：机器学习善于处理低维、分布相对简单的数据传统方法（设计图像特征）：图像通过人工设计的方法变为特征向量，经过机器学习进行分类使用深度学习：学习如何产生适合分类的特征
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。