添加博主cv夏一笑微信,带你进步: cvxiayixiao
点击订阅专栏查看专栏列表和对应知识点,本文为seg SAM系列文章,在持续更新。
1️⃣ SAM输入
🥬 SAM的提示编码器和图像编码器的输入,如何将输入图片和提示转为向量
他的模型架构由三部分组成:
1提示编码器
2图像编码器
3提示解码器。
如下的代码是具体调用过程,先由图像编码器进行静态编码,保存编码结果,之后输入提示,由提示编码器进行编码,最后图像编码和提示编码作为解码器的输入得到结果,进行训练
一个输入是
输入提示给提示编码器.其中过程主要对提示进行编码,输入稀疏编码sparse_embeddings和密集编码