ICLR 2022 语言模型驱动的语义分割算法:Language-Driven Semantic Segmentation

论文地址:

ICLR 2022 open review: https://openreview.net/forum?id=RriDjddCLN

主要工作:

本文提出了一种新的语言驱动语义图像分割的LSeg模型。LSeg使用一个文本编码器来计算描述性输入标签的嵌入(例如,“树木”或“建筑”),以及一个基于转换器的图像编码器,该编码器计算输入图像的密集嵌入。

该方法在测试时可以实现零镜头的语义分割。

具体实现:

Text encoder:

文本编码器将 N 个标签转换到连续的向量空间中,生成 N 个向量: T 1 ,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BIT可达鸭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值