全部论文标题更新于开源项目中,欢迎小伙伴加入开源项目:https://github.com/OpenSourcerer-A/awesome-medical-image-papers/tree/master
序号 | 题目 | 摘要(中文简要) | 链接 |
1 | MLIP: Enhancing Medical Visual Representation with Divergence Encoder and Knowledge-guided Contrastive Learning | 该论文的主要贡献是提出了MLIP框架,利用医学报告作为辅助信号,进行无监督预训练,改善医学视觉表示学习的泛化能力。MLIP通过图像-文本对比学习,在不同粒度上整合语言信息到视觉领域。模型包括全局对比学习、局部对齐对比学习和基于专家知识的类别级对比学习。实验证明,MLIP在图像分类、目标检测和语义分割等任务上具有良好的迁移性能。即使数据有限,MLIP也超越了最先进方法。 | https://arxiv.org/pdf/2402.02045.pdf |
2. | VoCo: A Simple-yet-Effective Volume Contrastive Learning Framework for 3D Medical Image Analysis | 本论文的主要贡献是提出了VoCo框架,利用上下文位置先验进行预训练,以解决3D医学图像分析中自监督学习缺乏高级语义的问题。VoCo通过基准裁剪和子体积对比预测上下文位置,将上下文位置先验隐式编码到模型表示中,有效提升了需要高级语义的下游任务性能。实验证明VoCo在六个下游任务上取得了卓越的效果。 | https://arxiv.org/pdf/2402.17300.pdf |
3 | Learned representation-guided diffusion models for large-image generation | 本文的主要贡献是提出了一种使用自监督学习表示来训练条件扩散模型的方法,在合成高质量的组织病理学和遥感图像方面取得成功。通过从自监督学习中获得的嵌入来指导生成过程,该方法能够生成具有空间一致性的补丁并构建较大的图像,提高了分类任务的准确性。此外,该方法还展示了从文本描述合成病理学和卫星图像的能力。实验证明该方法具有鲁棒性和泛化能力。 | https://arxiv.org/pdf/2312.07330.pdf |
4 | PrPSeg: Universal Proposition Learning for Panoramic Renal Pathology Segmentation | 本文的主要贡献是引入了一种名为PrPSeg的方法,通过综合肾脏解剖知识,全面分割肾脏内的结构。具体贡献包括设计了综合的肾脏病理普适命题矩阵,提出了基于令牌的动态头部单网络架构,以及引入了解剖损失函数来量化肾脏内对象之间的关系。该方法有助于进一步理解肾脏病理学,推动疾病诊断和治疗评估的发展。 | https://arxiv.org/pdf/2402.19286.pdf |
5 | Modality-Agnostic Structural Image Representation Learning for Deformable Multi-Modality Medical Image Registration | 本文的主要贡献是提出了一种与成像模态无关的结构表示学习方法,用于建立多模态图像之间的解剖对应关系。该方法利用了深度邻域自相似性和解剖感知对比学习,学习到具有区分性和对比不变性的深度结构图像表示。实验证明,相对于传统方法,该方法在解剖结构的区分性和准确性方面表现更好。 | https://arxiv.org/pdf/2402.18933.pdf |
6 | ChAda-ViT: Channel Adaptive Attention for Joint Representation Learning of Heterogeneous Microscopy Images. | 本文提出了ChAda-ViT,一种通道自适应Vision Transformer体系结构,适用于处理任意数量、顺序和类型的生物图像。通过引入通道间注意机制,方法在生物相关任务上表现优秀。此外,构建了IDRCell100k数据集,包含多种实验和通道类型,有助于深度学习在生物图像分析中的应用。 | https://arxiv.org/abs/2311.15264 |
7 | Feature Re-Embedding: Towards Foundation Model-Level Performance in Computational Pathology | 本文提出了一种名为R2T的方法,用于在线重新嵌入实例特征,改善计算病理学中的多实例学习任务的性能。与现有方法不同,R2T专注于在线特征重新嵌入,而不是预训练特征提取器或复杂的实例聚合器。实验证明,R2T可以显著提高多实例学习模型的性能,并且在性能上超过其他最新方法。 | https://arxiv.org/abs/2402.17228 |
8 | Generalizable Whole Slide Image Classification with Fine-Grained Visual-Semantic Interaction | 本文提出了一种名为FiVE的框架,用于整个切片图像(WSI)分类。通过结合局部视觉模式和细粒度病理语义,该框架提高了模型的泛化能力。通过使用大型语言模型提取细粒度病理描述,并利用任务特定的细粒度语义模块捕捉关键视觉信息,增强了表示学习和泛化能力。在TCGA肺癌数据集上,该方法在少样本实验中比其他方法的准确性高出至少9.19%。 | https://arxiv.org/abs/2402.19326 |
9 | Think Twice Before Selection: Federated Evidential Active Learning for Medical Image Analysis with Domain Shifts | 本文提出了一种名为FEAL的联邦证据主动学习方法,针对医疗机构间的数据标注成本高的问题。通过评估来自不同领域的本地数据的信息量,并利用狄利克雷先验分布和证据模型来处理不确定性,实现了数据评估和校准。同时,通过多样性松弛策略减少数据冗余并保持数据多样性。实验证明FEAL在联邦主动学习中具有优越性和高效性。 | https://arxiv.org/abs/2312.02567 |
10 | Continual Self-supervised Learning: Towards Universal Multi-modal Medical Data Representation Learning. | 本文提出了MedCoSS,一种针对多模态医学数据的连续自监督学习方法。与传统的特定模态预训练不同,MedCoSS通过多阶段预训练和回放策略来解决模态冲突和遗忘问题。实验证明,MedCoSS在广泛的医学数据集上具有出色的泛化能力和可扩展性。 | https://arxiv.org/abs/2311.17597 |
11 | Seeing Unseen: Discover Novel Biomedical Concepts via Geometry-Constrained Probabilistic Modeling. | 作者提出了一种基于几何约束的概率建模方法,解决了分布偏差和未知类学习的问题。他们还设计了一种谱图理论方法来估计潜在新类的数量。实验证实了该方法的有效性和普适性。 | Seeing Unseen: Discover Novel Biomedical Concepts via Geometry- Constrained Probabilistic Modeling |
12 | Each Test Image Deserves A Specific Prompt: Continual Test-Time Adaptation for 2D Medical Image Segmentation. | 提出了一种基于视觉提示的测试时自适应(VPTTA)方法,用于解决医学图像中的分布偏移问题。通过冻结预训练模型并为每个测试图像训练特定的提示,VPTTA方法能够在批归一化层中对齐统计数据,而无需更新模型。该方法还引入了低频提示和记忆库等机制来提升性能。实验结果表明,VPTTA在医学图像分割任务上优于其他最先进的方法。 | https://arxiv.org/abs/2311.18363 |
13 | 未完待续 |