本文参考的原始论文地址https://arxiv.org/abs/1703.06490v1
摘要
获取电子健康记录(EHR)数据推动了医学研究的计算进步。然而,各种对隐私的关注,会限制我们的访问和协作。共享综合EHR数据可以减少风险。该文提出了一种新的方法-医学生成对抗网络(MedGAN),来生成真实的综合EHRs。基于作为输入EHR数据集,medGAN可以通过自动编码器和生成对抗性网络的组合生成高维离散变量(例如二进制和计数特征)。同时通过小批次平均可以有效地避免模式崩溃,并通过批量归一化和快捷连接来提高学习效率。为了证明可行性,该文展示了medGAN基因。在包括分布统计、预测建模任务和医学专家评审在内的许多实验中,对实现与实际数据相当性能的合成EHR数据集进行评级。
主要贡献
(1)提出了一种高效的生成高维多热离散样本的算法-medGAN。特别是,