点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
小白导读
论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。
摘要
本文提出了一个联合检测视频关键帧和地标的框架U-LanD。我们解决了一个特别具有挑战性的问题,训练标签是有噪声和高度稀疏的。U-LanD建立在一个关键的观察基础上:一个只在关键视频帧上训练的深度贝叶斯地标检测器,与视频中的其他帧相比,这些帧的预测不确定性显著降低。我们使用这个观察作为一个无监督信号自动识别关键帧,我们检测地标。作为我们框架的测试平台,我们使用心脏的超声成像视频,其中稀疏和嘈杂的临床标签只能用于每个视频的单个帧。使用4493例患者的数据,我们证明U-LanD在R方评分上的绝对优势显著地超过了最先进的非贝叶斯模型,达到42%,几乎没有模型大小的负担。我们的方法是通用的,可以潜在地应用于其他具有噪声和稀疏训练标签的具有挑战性的数据。
论文创新点
我们证明了U-LanD在具有挑战性数据集的稀疏注释数据上的有效性,