前言
为学习最优传输问题(Optimal Transport),拜读了博客《最优运输(Optimal Transfort):从理论到填补的应用》,博文里简要介绍了三篇经典论文:
- Sinkhorn Distances: Lightspeed Computation of Optimal Transport ⇒ \Rightarrow ⇒ 博文
- Wasserstein Generative Adversarial Networks ⇒ \Rightarrow ⇒ 博文
- Missing Data Imputation using Optimal Transport ⇒ \Rightarrow ⇒ 博文
本系列博文打算精读之,下面是第三篇。认知有限,有不理解之处,也可能有理解不当或错误之处,请读者多多指教。
这篇论文主要讲数据填补(Missing Data Imputation):在机器学习中,数据往往是不全的,即含有缺失值,一种解决办法就是根据一定的算法填补它们。关于这一块,《西瓜书》和《统计学习方法》中都未讲述,以至于我只知道有这回事,并不了解其内容。于是在线找了一篇英文博文:Imputation (Missing Data),是书 A Guide on Data Analysis 中的第 11 章,不过很遗憾没找到 PDF。我已经将这篇博文翻译成了中文,以便补上相关知识缺口,感兴趣的可以看看。