谷歌最新提出无需卷积、注意力，纯MLP构成的视觉架构

最新推荐文章于 2022-05-28 18:43:55 发布

AI算法网奇

最新推荐文章于 2022-05-28 18:43:55 发布

阅读量1.9k

点赞数

分类专栏：深度学习宝典

本文链接：https://blog.csdn.net/jacke121/article/details/116465740

版权

深度学习宝典专栏收录该内容

984 篇文章 713 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

谷歌提出了一种新的视觉架构，该架构不依赖卷积和注意力机制，完全由多层感知器（MLP）组成。论文和相关代码已公开，吸引了业界的关注。复现代码也在pytorch平台上出现，模型大小约为70.96MB。

摘要由CSDN通过智能技术生成

11年it研发经验，从一个会计转行为算法工程师，学过C#，c++，java，android，php，go，js，python，CNN神经网络，四千多篇博文，三千多篇原创，只为与你分享，共同成长，一起进步，关注我，给你分享更多干货知识!

谷歌最新提出无需卷积、注意力，纯MLP构成的视觉架构

论文链接：https://arxiv.org/pdf/2105.01601.pdf

代码链接：https://github.com/google-research/vision_transformer

香港科技大学李铎同学的pytorch版的复现：https://github.com/d-li14/mlp-mixer.pytorch

这是pytorch的代码，加上了测试脚本

model size 70.96 m

import torch
import torch.nn as nn


class MlpBlock(nn.Module):
    def __init__(self, hidden_dim, ml

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI算法网奇

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

订阅专栏

基于可变形卷积和注意力机制的滚动轴承故障诊断

02-06

本文利用可变形卷积神经网络提高使用固定几何结构进行局部特征提取的能力，并引入注意力机制，充分考虑滚动轴承故障的特征来设计注意模块，以增强故障相关特征，忽略一些无关特征，提出了一种可变形多注意力卷积神经...

视觉Transformer的PyTorch实现合集！多种ViT变体！

阿木寺的博客

12-31

1625

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达转载自：机器之心 | 编辑：杜伟这个项目登上了今天的GitHub Trending。近一两年，Transformer 跨...

参与评论您还未登录，请先登录后发表或查看评论

Vision Transformer（1）：ViT源码逐行阅读解析

qq_42418728的博客

09-18

4320

上图是Visual Transformer原文的模型结构展示，可以看到模型包含了几个核心模块： 1.Norm层 2.Multi-Head Attention层 3.MLP多层感知器一、Norm层 class PreNorm(nn.Module): # fn：前馈网络，包含attention层以及残差结构 ''' param: dim输入维度 fn前馈网络层，选择Multi-Head Attn和MLP二者之一 ''' ...

MLP-Mixer的Pytorch实现和分析（二）

HHzdh的博客

10-16

959

model = MLPMixer(in_channels=3, dim=512, num_classes=1000, patch_size=16, image_size=224, depth=1, token_dim=256, channel_dim=2048).to(device) summary(model,(3,224,224)) 首先参数意义如下（输入图片为3*224*224）： in_channels：输入图片的通道数，3。 dim：卷积操.

Vision Transformer 必读系列之图像分类综述(三): MLP、ConvMixer 和架构分析

qq_39967751的博客

05-28

2578

文 @ 000007 号外号外：awesome-vit 上新啦，欢迎大家 Star Star Star ~ https://github.com/open-mmlab/awesome-vitgithub.com/open-mmlab/awesome-vit 0 前言在Vision Transformer 必读系列之图像分类综述(一)：概述一文中对 Vision Transformer 在图像分类中的发展进行了概述性总结。在Vision Transformer 必读系列之图像分类综述(二...

MLP理解

最新发布

10-26

基于结合注意力机制和膨胀卷积的HRNet遥感图像语义分割python源码.zip基于结合注意力机制和膨胀卷积的HRNet遥感图像语义分割python源码.zip基于结合注意力机制和膨胀卷积的HRNet遥感图像语义分割python源码.zip基于...

pytorch学习笔记（十）：MLP

逐梦er的博客

08-01

9275

文章目录1. 隐藏层2. 激活函数2.1 ReLU函数2.2 sigmoid函数2.3 tanh函数3 多层感知机4. 代码实现MLP4.1 获取和读取数据4.2 定义模型参数4.3 定义激活函数4.4 定义模型4.5 定义损失函数4.6 训练模型小结 1. 隐藏层多层感知机（multilayer perceptron, MLP) 在单层神经网络的基础上引入了一到多个隐藏层（hidden layer）。隐藏层位于输入层和输出层之间。图3.3展示了一个多层感知机的神经网络图，它含有一个隐藏层，该层中有5个隐

从MLP到神经网络

mpk_no1的博客

03-15

2万+

先看一下来自维基百科的介绍：多层感知器（Multilayer Perceptron,缩写MLP）是一种前向结构的人工神经网络，映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图，由多个的节点层所组成，每一层都全连接到下一层。除了输入节点，每个节点都是一个带有非线性激活函数的神经元（或称处理单元）。一种被称为反向传播算法的监督学习方法常被用来训练MLP。MLP是感知器的推广，克服了感知

ViT：视觉Transformer backbone网络ViT论文与代码详解

weixin_37737254的博客

06-06

3万+

VisualTransformerAuthor：louwillMachine Learning Lab 今天开始Visual Transformer系列的第一篇文章，主题是Visi...

多层神经网络（MLP）快速入门

weixin_36711901的博客

04-03

4029

这是我在2016年左右研一课程学习阶段做的一个课程学习交流ppt，讲的比较基础，适合大家快速入门，链接如下： https://wenku.baidu.com/view/6ff93e2959fb770bf78a6529647d27284b733794.html ...

NLP中MLP线性层的理解

跨过一座座山

07-31

2366

1、给定某变量X([batch_size, seq_len, input_dim])，经过线性层 Y=XW+b {Y=XW+b } Y=XW+b W维度[input_dim, out_dim]，b维度[out_dim]，Y维度为[batch_size, seq_len, out_dim]。假定input_dim=...

MLP(多层神经网络)与人工神经网络

木东的博客

02-09

8708

ANN的特点 (1) 高度的并行性人工神经网络是由许多相同的简单处理单元并联组合而成，虽然每个单元的功能简单，但大量简单单元的并行活动，使其对信息的处理能力与效果惊人。 (2) 高度的非线性全局作用神经网络系统是由大量简单神经元构成的，每个神经元接受大量其他神经元的输入，通过非线性输入、输出关系，产生输出影响其它神经元。网络就是这样互相制约相互影响，实现从输入状态空间到输出状态空间非线

迈微AI研习社 · 号主

05-06

679

当前，卷积神经网络（CNN）和基于自注意力的网络（如近来大火的 ViT）是计算机视觉领域的主流选择，但研究人员没有停止探索视觉网络架构的脚步。近日，来自谷歌大脑的研究团队（原 ViT 团队）提出了一种舍弃卷积和自注意力且完全使用多层感知机（MLP）的视觉网络架构，在设计上非常简单，并且在 ImageNet 数据集上实现了媲美 CNN 和 ViT 的性能表现。

各种attention的代码实现

Talk Is Cheap

09-29

1万+

base attention dot attention mlp attention multihead attention no attention pooling attention https://github.com/pytorch/translate/tree/master/pytorch_translate/attention attention bilinear attent...

神经网络的相关知识(1.python 实现MLp)

weixin_30267691的博客

08-29

280

转载于：http://blog.csdn.net/miangangzhen/article/details/51281989 #!usr/bin/env python3 # -*- coding:utf-8 -*- import numpy as np import math # definition of sigmoid funtion # num...

谷歌最新提出无需卷积、注意力 ，纯MLP构成的视觉架构

谷歌最新提出无需卷积、注意力，纯MLP构成的视觉架构