CNN和Transformer的区别:
1)CNN卷积归纳偏置对于规模较小的数据集较为有用,但对于较大的数据集(千万级规模数据集)而言,Transformer学习相关模式就足够了,甚至更加有效;
2)CNN提取局部信息,Transformer提取全局信息;
以一个目标检测网络为例,介绍Transformer的结构:
![](https://img-blog.csdnimg.cn/20210901152435669.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA6LaF57qn5peg5pWM6ZmI5aSn5L2s55qE6Lef54-t,size_12,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20210901152519905.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA6LaF57qn5peg5pWM6ZmI5aSn5L2s55qE6Lef54-t,size_13,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20210901152302419.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA6LaF57qn5peg5pWM6ZmI5aSn5L2s55qE6Lef54-t,size_16,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20210901153802469.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA6LaF57qn5peg5pWM6ZmI5aSn5L2s55qE6Lef54-t,size_16,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20210901153911788.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA6LaF57qn5peg5pWM6ZmI5aSn5L2s55qE6Lef54-t,size_14,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20210901154020288.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA6LaF57qn5peg5pWM6ZmI5aSn5L2s55qE6Lef54-t,size_14,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20210901154540316.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA6LaF57qn5peg5pWM6ZmI5aSn5L2s55qE6Lef54-t,size_12,color_FFFFFF,t_70,g_se,x_16)
CNN和Transformer的区别:
1)CNN卷积归纳偏置对于规模较小的数据集较为有用,但对于较大的数据集(千万级规模数据集)而言,Transformer学习相关模式就足够了,甚至更加有效;
2)CNN提取局部信息,Transformer提取全局信息;
以一个目标检测网络为例,介绍Transformer的结构: