深度学习
文章平均质量分 90
不想悲伤到天明
这个作者很懒,什么都没留下…
展开
-
Vit Transformer
vit :论文是基于,由于图像数据和词数据数据格式不一样,经典的transformer不能处理图像数据,在视觉领域的应用有限。本文提出的方法可以将transformer直接应用图像分类任务,引入Patch Embedding,位置编码等方法,克服了Transformer在处理图像数据时的限制。整体流程如下。1 )第一部分是Linear Projection of Flattened Patches ,也就是 Emdedding 层,主要的工作就是将图像数据转换成transformer可以处理的数据格式。原创 2024-03-26 21:31:58 · 847 阅读 · 0 评论 -
安装mmdet,mmcv-full
mmcv-full,mmdet安装,目标检测工具mmtracking安装原创 2022-06-18 19:06:22 · 16109 阅读 · 3 评论 -
Pytorch实战[实现对图像分类]
实现Pytorch完成类别识别Object基本掌握使用pytorch框架进行神经网络训练任务使用Pycharm,Google Colab完成代码编写本次实验只是来熟悉一下训练的流程,因此模型比较简单1. 编写代码数据集介绍 CIFAR-10数据集包含6000张大小是(32,32)的图片数据,有10个类别。训练集有5000张,测试集1000张。数据读取以及数据加载# 创建一个transformtransform = torchvision.transforms.Compose([原创 2022-05-25 20:04:39 · 3506 阅读 · 3 评论 -
self-attention的介绍和代码手写
self-Attention的介绍和代码实践原创 2022-05-12 17:19:31 · 3448 阅读 · 2 评论 -
Keras MNIST 手写数字识别数据集
下载 MNIST 数据1 导入相关的模块import kerasimport numpy as npfrom keras.utils import np_utils import osfrom keras.datasets import mnist 2 第一次进行Mnist 数据的下载(X_train_image ,y_train_image),(...原创 2019-04-27 20:39:16 · 3410 阅读 · 0 评论 -
现实世界中的数据张量
现实世界中的数据张量我们用几个你未来会遇到的示例来具体介绍数据张量。你需要处理的数据几乎总是以下类别之一。 向量数据:2D 张量,形状为 (samples, features) 。 时间序列数据或序列数据:3D 张量,形状为 (samples, timesteps, features) 。 图像:4D张量,形状为 (samples, height, width, channels) 或...原创 2019-05-31 20:38:53 · 1647 阅读 · 0 评论 -
搭建卷积神经网络 Demo - 实现Cifar-10数据集分类
目录目录实现卷积神经网络的简例 卷积神经网络的一般框架 用简单卷积神经网络实现Cifa -10 数据集的分类实现卷积神经网络的简例 相较于全连接神经网络而言,卷积神经网络相对进步的地方就是卷积层结构和池化层的引入,这两次都是卷积神经网络的重要组成部分。卷积神经网络的一般框架上图展示了一个简单的图像分类...原创 2019-08-02 13:44:33 · 2164 阅读 · 2 评论