论文笔记
文章平均质量分 84
hellopipu
这个作者很懒,什么都没留下…
展开
-
[ECCV2018] [MUNIT] Multimodal Unsupervised Image-to-Image Translation
贡献:为 unpaired image translation 的生成图像提供多样性提出假设:1、图像的表达可以分成为style code 与 content code;2、不同领域的图像,共享一个content space,但是不同的style space;style code captures domain-specific properties, and content code is domain-invariant. we refer to “content” as the underlin原创 2020-06-08 00:54:02 · 1549 阅读 · 4 评论 -
[CVPR2020] StarGAN v2
基于StarGAN,改进点(B)将原ACGAN+PatchGAN的鉴别器 换成 多任务鉴别器,使生成器能转换全局结构。原创 2020-06-02 07:34:23 · 12381 阅读 · 37 评论 -
[调研] 通用实例分割方法
目前的实例分割方法可分为3类:top-down,也叫做 detect-then-segment,顾名思义,先检测后分割,如FCIS, Mask-RCNN, PANet, Mask Scoring R-CNN;bottom-up,也叫Embedding-cluster,将每个实例看成一个类别;然后按照聚类的思路,最大类间距,最小类内距,对每个像素做embedding,最后做grouping分出不同的instance。Grouping的方法:learned associative embedding,A原创 2020-05-23 15:52:15 · 3906 阅读 · 0 评论 -
[论文笔记] SPECTRAL NORMALIZATION FOR GENERATIVE ADVERSARIAL NETWORKS
对 normalization 进行改进优点:Lipschitz常数原创 2019-05-26 18:28:12 · 3226 阅读 · 1 评论 -
[MICCAI2019] Multi Scale Curriculum CNN for Context-Aware Breast MRI Malignancy Classification
作者信息Christoph Haarburger,RWTH Aachen University, Germanycurriculum learning原创 2019-08-24 20:46:09 · 1100 阅读 · 2 评论 -
[MICCAI2019] FocusNet: Imbalanced Large and Small Organ Segmentation with an End-to-End Deep Neural
FocusNet: Imbalanced Large and Small Organ Segmentation with an End-to-End Deep Neural Network for Head and Neck CT Images作者信息:Yunhe Gao ,商汤Hongsheng Li 大佬,CUHK针对医学影像多类别分割任务的一个痛点,分割label不平衡。本文具体指头...原创 2019-08-20 20:46:36 · 1804 阅读 · 1 评论 -
[MICCAI2019] Models Genesis: Generic Autodidactic Models for 3D Medical Image Analysis
作者信息Zongwei Zhou, Arizona State University医疗影像的一个痛点,数据少,常常需要自然图像的预训练模型做迁移学习,最广泛的预训练模型ImageNet是2D的,而医疗影像大多3D,且3D数据包含了影像的结构信息,一般而言,3D训练效果会比2D好。3D预训练模型的缺乏是本文的一个出发点。(最近腾讯有出一个3D医疗影像的预训练模型https://github...原创 2019-08-16 16:55:50 · 2263 阅读 · 0 评论 -
[MICCAI2019] Global and Local Interpretability for Cardiac MRI Classification
深度学习可解释性原创 2019-08-17 20:11:24 · 856 阅读 · 0 评论 -
[MICCAI2019] Unified Attentional Generative Adversarial Network for Brain Tumor Segmentation From Mu
Unified Attentional Generative Adversarial Network for Brain Tumor Segmentation From Multimodal Unpaired Images作者信息,Wenguang Yuan, 华南理工原创 2019-09-02 17:52:12 · 588 阅读 · 2 评论 -
[MICCAI2019] Pick-and-Learn: Automatic Quality Evaluation for Noisy-Labeled Image Segmentation
作者信息Haidong Zhu, Tsinghua 电机系文章针对医学影像中标注质量的痛点进行了探究,pick & learn,顾名思义,文章用到的解决方法为:对每个mini-batch中样本的标注质量进行评分,然后根据标注质量高低对相应样本的loss进行加权,得到mini-batch的最终loss后再反向传播,更新网络。Method如下为方法框图,包含3个主要模块:segmen...原创 2019-09-04 14:38:05 · 1188 阅读 · 2 评论 -
[MICCAI2019] Conv2Warp: An unsupervised deformable image registration with continuous convolution an
Conv2Warp: An unsupervised deformable image registration with continuous convolution and warping作者信息:Sharib Ali , Oxford,Institute of Biomedical Engineering贡献:使用可变形卷积学习局部非线性形变;使用可学习的 bicubic Catm...原创 2019-09-06 15:21:49 · 1197 阅读 · 0 评论 -
[MICCAI2019] Learning shape priors for robust cardiac MR segmentation from multi-view images
MICCAI2019 Oral作者信息Chen Chen,Biomedical Image Analysis Group, Imperial College London贡献:设计了Shape MAE(Multi-View Auto Encoder)结构来学习多视角下心脏形状的latent 表达设计了分割网络 Multi-View Unet,能够结合MAE学习到的解剖形状的先验知识,...原创 2019-09-08 12:44:10 · 750 阅读 · 3 评论 -
[论文笔记] A Fast diffeomorphic image registration algorithm
NeuroImage 2007, 提出DARTEL (Diffeomorphic Anatomical Registration using Exponentiaed Lie algebra) 快速配准方法,该文目前有4818个引用作者信息:John Ashburner, Wellcome Trust Center for Neuroimaging, UK评价配准方法:得到的形变结果是否编...原创 2019-09-26 21:32:58 · 2015 阅读 · 0 评论 -
[论文笔记] Self-Attention Generative Adversarial Networks
问题:卷积只有局部的感受野,大范围的依赖关系只能通过多层卷积进行处理。这可能影响网络学习到长依赖关系:1、小模型可能无法学习;2、优化算法可能很难找到多层卷积的合适参数来捕捉这种依赖关系;3、这种参数化可能对之前没见过的图片很不稳定,容易失败。单纯增大卷积核扩大感受野是个办法,但增大了计算量文章贡献:1、SAGAN 中引入:引入attention机制学习long range depende...原创 2019-05-10 16:56:14 · 757 阅读 · 0 评论 -
[论文笔记] Learning High-level Prior with Convolutional Neural Networks for Semantic Segmentation
2015年arXiv预印本文章作者单位中科大,清华,港科技文章的主要贡献在于利用CNN将high-level prior融入了语义分割中。受人类视觉识别系统的启发,文章借鉴了三层生成结构:高层编码,中层分割,低层图像。作者提出利用CVAE(条件变分自编码器)来建立这三层结构之间的联系,从而为语义分割引入全局先验。具体而言,网络的实现包含3个部分,图像编码部分(image encoder...原创 2018-09-28 12:14:22 · 327 阅读 · 0 评论 -
[论文笔记]基于互信息的医学图像配准综述
原文 : Mutual-Information-Based Registration of Medical Images: A Survey2003年的综述类文章,目前已有3200+引用,算得上经典,值得一读。原创 2018-09-29 11:15:27 · 5550 阅读 · 3 评论 -
[论文笔记] UNet++: A Nested U-Net Architecture for Medical Image Segmentation
2018年6月的文章,DLMIA2018会议,作者单位Department of Biomedical Informatics, Arizona State University 文章对Unet改进的点主要是skip connection。作者认为skip connection 直接将unet中encoder的浅层特征与decoder的深层特征结合是不妥当的,会产生semantic gap。...原创 2018-10-09 22:45:24 · 18422 阅读 · 17 评论 -
[论文笔记] MobileNet
作者团队:谷歌关注点:同时优化网络模型的速度与大小related worksA1、网络受depth wise seperable convolution (在Inception、Xception中也有用到)的启发A2、factorized networkA3、Squeezenet使用到了bottleneck的方法B1、对预训练网络的shrinking、factorizing以及comp...原创 2018-11-01 14:23:27 · 198 阅读 · 0 评论 -
[论文笔记] Inception V1-V4 系列以及 Xception
作者团队:谷歌Inception V1 (2014.09)网络结构主要受Hebbian principle 与多尺度的启发。Hebbian principle:neurons that fire togrther,wire together单纯地增加网络深度与通道数会带来两个问题:模型参数量增大(更容易过拟合),计算量增大(计算资源有限)。改进一:如图(a),在同一层中采用不同大小的...原创 2018-11-02 23:07:46 · 2991 阅读 · 1 评论 -
[论文笔记] ShuffleNet
作者团队:旷厂时间:2017年12月贡献:两个新操作,pointwise group convolution 和 channel shuffle。优于MobileNet一、IntroductionXception、ResNeXt在非常小的网络上效率很低,主要是因为dense 1×11\times11×1 convolution 计算量较大。在MobileNet中分析过,depthwis...原创 2018-11-01 20:39:53 · 1264 阅读 · 0 评论 -
[论文笔记] SegAN: Adversarial Network with Multi-scale L1 Loss for Medical Image Segmentation
文章于2017年6月提交到Arxiv,投稿于 Neuroinformatics (2018),Published online: 3 May 2018作者单位:Department of Computer Science and Engineering,Lehigh University文章截止2019.3.25的引用量为50文章代码见github首先,作者提出了一个问题:在医学图像分割...原创 2019-03-25 23:49:04 · 3861 阅读 · 3 评论 -
[论文笔记] Pose2Instance: Harnessing Keypoints for Person Instance Segmentation
作者单位: ucsd、google、cornell关键词: person instance segmentation、keypoint创新点:利用关键点信息提升人像分割的精度数据集:COCO 分割数据集以及关键点数据集 (不包括标记为“crowd”的人像)训练集验证集张数4517421634人像数18531688153提出的模型...原创 2018-11-05 23:05:38 · 626 阅读 · 0 评论 -
[论文笔记] Context Encoding for Semantic Segmentation
CVPR2018 ORAL2018年3月,作者单位:Rutgers University作者博客EncNet_cvpr2018_slides源码图1. EncNet网络结构图贡献1、Context Encoding Module + Semantic Encoding Loss (SE-loss)这个context encoding module和SENet的SE-block大同小...原创 2019-04-01 19:03:45 · 552 阅读 · 0 评论 -
[论文笔记] Mode Seeking Generative Adversarial Networks for Diverse Image Synthesis
作者单位:北大,加利福尼亚大学Abstract针对cGAN输出样本的多样性问题(也是著名的mode collapse问题 ),文章给出的解决方法是在损失函数上加入一个简单的正则项mode seeking regularization term,其主要思想是最大化输出图像之间的距离 与 对应latent code之间的距离 的比值。Motivation来看看作者是如何对文章的motivati...原创 2019-04-12 10:59:06 · 3007 阅读 · 1 评论 -
[论文笔记] A Note on the Inception Score
Inception Score 上界的推导见文章 GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium原创 2018-10-12 21:40:20 · 2023 阅读 · 0 评论 -
[论文笔记] LARGE SCALE GAN TRAINING FOR HIGH FIDELITY NATURAL IMAGE SYNTHESIS
ICLR2019在审文章,作者单位DeepMind文章希望既保证GAN生成图像的保真度又保证生成图像的多样性。对此,作者认为他们有三点贡献:1、论证了GANs能通过scaling来提升性能。他们使用与原先技术相比,2~4倍的参数量和8倍的batch size,引入了两种简单的结构调整方法来提升网络的可扩展性,并修改一种正则化方案来提高conditioning。2、上述修改产生的另一种影响是...原创 2018-10-10 22:54:29 · 4432 阅读 · 1 评论