自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Tranformer的九种常见结构,讨论改进Tranformer的一般方法

6. XLNet:eXtreme Learning Machine Network,是一种自回归的Transformer模型,与GPT不同的是,它通过使用排列语言模型来解决自回归模型中的顺序偏置问题。2. 修改注意力机制:注意力机制是Transformer的核心,可以基于不同的需求修改注意力矩阵的计算方式,如使用不同的注意力头数、引入稀疏注意力、使用自适应注意力等。8. ALBERT:A Lite BERT,是对BERT模型的轻量化改进,通过参数共享和分解来减少模型的大小和训练时间。

2023-12-19 13:54:29 149

原创 Tranfomer,ViT,Swin-TR,DETR,SETR的网络结构

Swin-TR通过将图像划分为更大的窗口,并引入层次化的窗口交换机制,使得每个窗口能够汇聚和交换更多的全局信息,从而提高了对大尺寸图像的处理能力。通过将图像块的序列输入Transformer模型中,ViT能够利用全局自注意力机制建模图像的全局依赖关系,从而实现对图像的分析和生成。2. 特征融合和注意力机制的改进:可以探索更强大的特征融合方法和注意力机制,以增强网络对输入数据的建模能力。1. 模型深度和宽度的优化:可以通过增加模型的深度和宽度来增强网络的表示能力,提高模型的性能。

2023-12-19 13:52:34 92

原创 FCN,PSPNET,Deeplab-v3的网络结构

具体来说,PSPNET将特征图分成不同大小的区域,并分别对这些区域进行池化操作,最后将池化后的特征图级联起来,得到全局上下文信息丰富的特征图。最后,通过卷积和上采样操作,将特征图转换为与输入图像大小相同的分割结果。综上所述,FCN、PSPNET和Deeplab-v3都是用于语义分割任务的神经网络,它们的网络结构都经过了特殊设计,以提高分割结果的精度和鲁棒性。这些网络结构在特征提取和分割预测方面都采用了不同的技术和策略,从而实现了在图像上密集地预测像素的能力,并取得了较好的语义分割效果。

2023-12-19 13:29:56 57

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除