深度学习预预训练与MMPretrain

最新推荐文章于 2024-10-04 05:48:08 发布

爱学习的羽

最新推荐文章于 2024-10-04 05:48:08 发布

阅读量813

点赞数

分类专栏： pytorch 文章标签：深度学习人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37437892/article/details/131055507

版权

pytorch 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

MMPretrain是一个强大的算法库，支持多种主干网络模型的自监督和多模态学习。它提供了丰富的数据集、训练策略和易用的API，包括图像分类、语义描述、视觉问答等任务。该库还允许用户配置GPU和分布式环境，优化训练效率。

摘要由CSDN通过智能技术生成

MMPretrain算法库

在这里插入图片描述
优势：

含有各种主干网络模型
自监督学习功能
多模态学习功能
丰富的数据集
含有训练技巧和策略
易用，例如可解释性分析、推理api

包含多种丰富任务的开箱即用推理api

图像分类
图像语义描述
视觉问答
视觉定位
检索

在这里插入图片描述
安装步骤

配置文件中含有模型训练中的设置，影响精度和速度,主要涉及以下几个方面：

模型结构
数据
训练策略
运行时gpu、分布式环境配置
辅助功能日志、定时保存权重

代码框架以及各个目录的含义用法：
在这里插入图片描述
数据流

配置文件的运行方式：

经典主干网络

在这里插入图片描述

在这里插入图片描述
vision transformer
将图像切成若干16*16的小块，排列成“词向量”

注意力机制：为了实现层次化特征

后层特征是空间邻域内的前层特征的加权求和
在这里插入图片描述

自监督学习

不依赖人工标注，利用互联网上的海量数据
在这里插入图片描述

在这里插入图片描述

多模态算法

在这里插入图片描述

爱学习的羽

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。