医学影像
文章平均质量分 89
sweet_Mary
这个作者很懒,什么都没留下…
展开
-
Segment Anything
参考:原创 2024-06-08 16:49:13 · 386 阅读 · 0 评论 -
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Mode
计算image transformer输出query表征Z(与可学习query长度相同)与text transformer输出文本表征 t 中【CLS】token相似性,选取最大值作为图像文本对相似度。为防止信息泄露,作者使用单模态self-attention mask,query与text不能互相可见,防止从文本直接学习。原创 2024-06-08 12:04:10 · 1002 阅读 · 0 评论 -
图像分割模型LViT-- (Language meets Vision Transformer)
使得无标签数据可以像有标签数据一样为模型提供监督信息。这种方式能够有效利用大量的无标签数据,提高模型的泛化能力和鲁棒性。左面的红方框是Transformer支路,右面的红方框是CNN支路。双u型结构:u型CNN支路+u型Transformer支路。原创 2024-05-28 23:12:53 · 864 阅读 · 1 评论 -
医学图像分割--U-net变种
这里以3*256*256的图片为例,手动推算了一遍,有问题的小伙伴可以对照着代码自己手推一遍。这是我自己手推的示意图,没明白的朋友建议先补一下注意力机制的Q、K、V,然后来看看图鸭~也是类似的,朋友们一定要自己推导一遍U-net,这个后面的内容看起来就会很轻松。类(水个字哈哈哈)---两个卷积层、批量归一化和ReLU激活函数。由两个连续卷积层(可选批量归一化)和ReLU激活函数组成的模块。网络结构,包括编码(下采样)和解码(上采样)部分。普通的卷积模块(两个卷积层和批归一化层)类---上采样卷积块。原创 2024-05-27 15:52:50 · 1147 阅读 · 1 评论 -
医学图像分割
医学影像原创 2024-05-23 17:36:27 · 983 阅读 · 0 评论