- 博客(19)
- 收藏
- 关注
原创 Escaping Saddle Points for Effective Generalizationon Class-Imbalanced Data 论文阅读
近年来,由于精心策划的数据集[34,45]的可用性,在视觉识别方面取得了很大进展,这些数据集在不同类别的样本频率方面得到了人为平衡。然而,现代现实世界的数据集往往是不平衡的(即长尾等)[33,49,50],并遭受各种分布转移。像深度神经网络这样的过度参数化模型通常会过度拟合具有高频率样本的类,而忽略少数样本(尾部)[8,50]。在这种情况下,当对关注少数数据性能的指标进行评估时,这些模型的表现很差。这些指标是评估各个领域(如公平性[14]、医学成像[57]等)模型的基本和实用标准。
2024-04-26 19:57:30 894 2
原创 Pseudo Label-Guided Data Fusion and OutputConsistency for Semi-Supervised Medical Image 阅读
分割是医学图像处理与分析领域的一项基础任务[1]。临床医学中准确的图像分割为临床医生提供有价值的辅助信息,促进快速、准确、高效的诊断决策[2]。然而,手动标注感兴趣的区域非常耗时,并且依赖于医生的临床专业知识,导致大量的工作量和潜在的错误[3]。随着深度学习的快速发展,卷积神经网络(CNN)及其变体在计算机视觉任务中展示了强大的图像处理能力。全卷积网络[4]和U-Net[5]的引入极大地推动了自动图像分割[6]的发展。在此基础上,出现了许多进一步提高分割算法性能的研究[7][8][9]。
2024-04-26 17:28:22 905 1
原创 RCPS: Rectified Contrastive Pseudo Supervision for Semi-Supervised Medical Image Segmentation 论文阅读
医学图像中解剖结构或病变的准确、自动分割在许多领域都是非常需要的临床应用,包括影像引导介入、放射治疗、计算机辅助诊断等[1]。深度学习的快速发展导致了许多用于医学图像定量分析的图像分割方法的出现。然而,这些方法通常遵循完全监督的方式,这需要大量注释良好的数据才能达到令人满意的性能。同时,医学图像的手工注释成本高且费力,特别是对于CT和MRI扫描等3D图像。因此,开发能够减少对大量训练数据集需求的自动分割方法至关重要。
2024-04-13 20:05:10 1045 1
原创 VoCo: A Simple-yet-Effective Volume Contrastive Learning Framework for 3D Medical Image Analysis 阅读
深度学习在三维医学图像分析方面取得了突出的成就[52,21,39,33],但由于所需专家注释的昂贵成本而受到严重阻碍[49,23]。为了解决这个问题,自监督学习(self - supervised Learning, SSL)因其在没有注释的情况下学习表征的能力而受到了极大的关注[10,11,6,28,20]是三维医学图像分析中重要的高效标签解决方案[69,50,32,34,36]。
2024-04-11 01:28:29 555 1
原创 HuatuoGPT, Towards Taming Language Models To Be a Doctor 阅读笔记
医学是人类生存的重要支柱,其有效性在很大程度上依赖于专业人员的专业知识和经验。然而,像ChatGPT这样的大型语言模型(llm)的出现预示着这种经验驱动领域的变革时代(Wang et al, 2023a)。llm通过利用回顾性数据和生成前瞻性来学习和模仿人类语言输出。考虑到法学硕士和医学的经验驱动型基金会的融合,我们认为法学硕士在改善医疗咨询和诊断支持方面具有巨大的潜力。向ChatGPT学习?近期研究(Taori et al ., 2023;
2024-03-30 22:17:24 509 2
原创 MemoryBank: Enhancing Large Language Modelswith Long-Term Memory 论文阅读
ChatGPT (OpenAI, 2022年)和GPT-4 (OpenAI, 2023年)等大型语言模型(llm)的出现,导致从教育、医疗保健到客户服务和娱乐等各个领域的影响力越来越大。这些强大的人工智能系统展示了非凡的能力理解并产生类似人类的反应。尽管法学硕士具有非凡的能力,但一个关键的限制是他们缺乏长期记忆,这是人类沟通的一个重要方面,特别是在需要持续互动的场景中,如个人陪伴、心理咨询和秘书任务。人工智能中的长期记忆对于维持上下文理解、确保有意义的交互和理解用户行为至关重要。
2024-03-27 21:44:04 946 1
原创 MixMAE(MixMIM):用于分层视觉变压器有效预训练的混合和掩码自编码器 论文阅读
以自我监督的方式利用未标记的视觉数据来学习表征是有趣但具有挑战性的。继BERT[14]在自然语言处理中,预训练MIM在学习各种下游视觉任务的视觉表示方面取得了巨大成功[4,21,44,50,51],包括图像分类[13]、目标检测[31]、语义分割[56]、视频分类[20]和运动控制[50]。
2024-03-24 19:16:00 681
原创 MIC: Masked Image Consistency for Context-Enhanced Domain Adaptation 阅读笔记
在无监督域自适应(UDA)中,在源数据(如合成)上训练的模型在不访问目标注释的情况下适应目标数据(如现实世界)。大多数以前的UDA方法都难以处理在目标域上具有相似视觉外观的类,因为没有可用于学习轻微外观差异的基础真理。为了解决这个问题,我们提出了一个掩蔽图像一致性(MIC)模块,通过学习目标域的空间上下文关系作为鲁棒视觉识别的额外线索来增强UDA。MIC增强了掩膜目标图像的预测之间的一致性,其中随机补丁被保留,而伪标签是由指数移动平均教师基于完整图像生成的。
2024-03-19 20:33:57 659
原创 Towards Generic Semi-Supervised Framework forVolumetric Medical Image Segmentation 代码详解
代码: xmed-lab/GenericSSL: NeurIPS 2023: Towards Generic Semi-Supervised Framework for Volumetric Medical Image Segmentation (github.com)数据处理部分代码,仅分析LA与Synapse数据集:code/data/StrongAug.py 数据增强
2024-03-19 19:13:52 168
原创 llama_index 官方文档阅读笔记 (续...KG RAG构建)
参考链接:Neo4j作为图形存储集成得到支持。您可以使用LlamaIndex和Neo4j持久化、可视化和查询图形。此外,使用和直接支持现有的Neo4j图。如果你以前从未使用过Neo4j,你可以在下载桌面客户端。打开客户端后,创建一个新项目并安装apoc集成。提供完整说明。只需点击您的项目,选择左侧菜单上的Plugins,安装APOC并重新启动服务器。我们支持集成,直接在Nebula中持久化图形!此外,您可以使用为Nebula图生成密码查询并返回自然语言响应。
2024-03-14 22:46:17 950 1
原创 ITRANSFORMER: INVERTED TRANSFORMERS AREEFFECTIVE FOR TIME SERIES FORECASTING 论文阅读
论文地址: https://arxiv.org/abs/2310.06625代码: GitHub - thuml/iTransformer: Official implementation for "iTransformer: Inverted Transformers Are Effective for Time Series Forecasting" (ICLR 2024 Spotlight), https://openreview.net/forum?id=JePfAI8fah摘要最近线性预测模型的
2024-03-13 18:57:01 941
原创 LLM Evaluation Metrics: Everything You Need for LLM Evaluation阅读笔记
评估指标架构LLM 评估指标是根据您关心的标准对 LLM 的产出进行评分的指标。例如,如果您的 LLM 应用程序旨在总结新闻文章的页面,则需要一个 LLM 评估指标,该指标根据以下条件进行评分:摘要是否包含来自原始文本的足够信息。摘要是否包含与原文相矛盾或幻觉。此外,如果您的 LLM 应用程序具有基于 RAG 的架构,您可能还需要为检索上下文的质量打分。关键是,LLM 评估指标根据 LLM 应用程序设计要执行的任务来评估它。(请注意,LLM 应用程序可以只是 LLM 本身!
2024-03-09 00:03:21 914 1
原创 llama_index 官方文档阅读笔记 (持续更新版)
无论是 OpenAI 还是任意数量的托管 LLM 还是您自己的本地运行模型,LLM 都会在每一步使用,从索引和存储到查询和解析您的数据。:每个索引策略都有相应的查询策略,有很多方法可以提高您检索的内容的相关性、速度和准确性,以及 LLM 在将其返回给您之前对它做了什么,包括将其转换为结构化响应,例如 API。LlamaIndex 提供了必要的抽象,以便更轻松地摄取、构建和访问私有或特定于域的数据,以便将这些数据安全可靠地注入 LLM,以实现更准确的文本生成。这使其具有更大的灵活性,可以处理更复杂的任务。
2024-03-08 20:42:46 1479 1
原创 SFFN:Detection of heterogeneous parallel steganography for low bit-rate VoIP speech streams 论文阅读
论文地址:https://www.sciencedirect.com/sc ience/article/pii/S0925231220312558摘要: 本文考虑了检测流媒体上的异构并行隐写术(HPS)的新任务。该任务是利用多种正交隐写方法检测隐藏在流媒体帧中的机密消息是否存在。我们的目标是在这项工作中检测低比特率互联网协议语音 (VoIP) 语音流的 HPS,这是一种广泛使用的流媒体。具体来说,采用量化索引调制和音调调制隐写术这两种隐写方法来形成HPS。对于现有的隐写分析方法来说,检测低比特率 VoIP
2024-03-07 18:01:11 796
原创 大模型置信度评估问题(持续更新)
logprobs:是否返回 output tokens 的对数概率(布尔类型,默认为False如果为真,则返回消息内容中返回的每个 output token 的对数概率。目前 gpt-4-vision-preview 模型还不支持此选项。:一个介于 0 到 5 之间的整数,指定在每个 token 位置返回最有可能的 tokens,并且每个 token 都有一个关联的对数概率。如果使用了这个参数,logprobs 就必须设置为 True。显然,这两个参数被设计为协同工作。理论上,调整。
2024-03-07 17:26:17 809
原创 扩散模型在语义分割任务中的优越性
扩散模型架构可以灵活地适应不同的任务需求,例如,可以通过调整反向扩散步骤的数量、引入引导信号或优化采样策略来提升语义分割的效果。- 扩散模型能够在没有明确监督信号的情况下,从随机噪声中逐渐重构出清晰的图像结构,这使得其有可能应用于半监督或无监督的语义分割场景,减少对大量标记数据的依赖。- 研究表明,预训练的扩散模型即使在标注数据稀少的情况下也能取得较好的性能,这意味着它们在面对有限标签资源的场景下具有更好的泛化能力和标签利用效率。
2024-03-05 14:07:27 450
原创 Towards Generic Semi-Supervised Framework forVolumetric Medical Image Segmentation 论文阅读
面向体积医学图像分割的通用半监督框架论文:[2310.11320] Towards Generic Semi-Supervised Framework for Volumetric Medical Image Segmentation (arxiv.org)代码:GitHub - xmed-lab/GenericSSL:NeurIPS 2023:迈向用于体积医学图像分割的通用半监督框架摘要3D 医学图像中的体积标记是一项耗时的任务,需要专业知识。因此,人们越来越有兴趣使用半监督学习(SSL)技术来训练具有有
2024-03-03 20:06:19 964
原创 MedSegDiff阅读笔记
为了实现自适应区域注意,将当前步骤的分割图集成到每一步的图像先验编码中。具体实现是在特征层面上以多尺度的方式将当前步骤的分割掩模与先验图像进行融合。为了消除此过程中损坏的给定掩模中的高频噪声,提出特征频率解析器(FF-Parser)来过滤傅立叶空间中的特征。它的作用是约束xt特征中与噪声相关的成分,可被视为频率滤波器的可学习版本,它全局调整特定频率的分量。了MedSegDiff,即眼底图像的视杯分割、MRI图像的脑肿瘤分割和超声图像的甲状腺结节分割。另一方面,当前步骤的分割图包含增强的目标区域,但不准确。
2024-03-03 16:48:19 362
原创 MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model 论文阅读
最近的许多研究还发现,它在许多其他视觉任务中也很有用,比如图像去模糊、超分辨率和异常检测。受DPM成功的启发,我们提出了第一个基于DPM的一般医学图像分割模型,我们将其命名为MedSegDiff。为了增强DPM在医学图像分割中的分步区域注意力,我们提出了动态条件编码,该编码为每个采样步建立状态自适应条件。我们在三种不同图像模式的医学分割任务上验证了MedSegDiff,即眼底图像的视杯分割、MRI图像的脑肿瘤分割和超声图像的甲状腺结节分割。
2024-02-23 10:32:12 416
北邮果园Java课程wordle游戏实现
2024-03-03
北邮果园大四安全与认证课件以及翻译
2024-03-03
北邮果园大四云计算课件以及翻译
2024-02-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人