- 博客(10)
- 收藏
- 关注
原创 Vision Transformer学习(一):Embeddings部分
VIT模型就是对原始图片进行分块,展平成序列,输入进原始Transformer模型的编码器Encoder部分,最后接入一个全连接层对图片进行分类。
2022-11-20 19:25:47 1666
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
VIT模型就是对原始图片进行分块,展平成序列,输入进原始Transformer模型的编码器Encoder部分,最后接入一个全连接层对图片进行分类。
2022-11-20 19:25:47 1666
TA创建的收藏夹 TA关注的收藏夹
TA关注的人