在医学成像中,数据存储档案是基于临床假设的。不幸的是,这意味着当你想要提取一个图像时,比如一个正面的胸部x光片,你通常会获得一个存储了许多其他图像的文件夹,并且没有简单的方法来对它们加以区分。
图1:这些图片来自于相同的文件夹是有道理的,因为在放射学中我们记录的是病例而非图像。这是病人受伤后,同时扫描的所有身体部位。
根据机构的不同,你可能会得到水平或垂直翻转的图像。它们可能包含反向像素值。他们可能会旋转。问题是,当处理一个巨大的数据集,比如5万到十万个图像时,你怎么能在没有医生指导的情况下发现这些畸变呢?
您可以尝试编写一些优雅的解决方案,比如:因为大多数胸部X光高度都比宽度高,因此在X光的两侧有黑色的边界,所以如果底部有超过50个黑色的像素行,那么它可能旋转了90度。
进入software 2.0,我们使用机器学习来构建我们无法自行编码的解决方案。像旋转的图像这样的问题是embarrassingly learnable。这意味着机器可以像人类一样完美地实现这些任务。
我们真正需要问的第一个问题是现在的问题是embarrassingly learnable么?
考虑到大多数的研究都是正常的,你需要一个非常高的精确度来防止排除那些“好“的研究。我们应该瞄准99.9%的目标。
有太多的变化,有太多的相似之处。我经常在演讲中使用这个例子:我甚至无法想象如何编写规则来直观地区分这两种类型的动物。这并不是令人embarrassingly learnable。