出现原因
当图片文件有超过89478485个像素点(若为16:9的图片,其分辨率约为12608×7092)时使用PIL会触发DecompressionBombWarning警告。如此高的上限,通常用途情况下不会触发此警告。但是当处理一些大型图片,例如:天文照片(嫦娥2号月面图片~1.38GB)、高dpi的大尺寸扫描图(舰娘官方挂历扫图@720dpi ~300MB),会导致PIL拒绝加载,并提示DecompressionBombWarning警告。对于这个警告的处理也要具体问题具体分析:解压后的数据小于当前物理内存的图片,可以通过设置Image.MAX_IMAGE_PIXELS来适当提高触发警告的阈值,继而强制加载。解压后的数据大小可以用图片尺寸与色彩位深来估计。
>>> from PIL import Image
>>> im = Image.open(r'some.jpf')
C:\Users\whose\AppData\Local\Programs\Python\Python36\lib\site-packages\PIL\Image.py:2438: DecompressionBombWarning: Image size (145458930 pixels) exceeds limit of 89478485 pixels, could be decompression bomb DOS attack.
DecompressionBombWarning)
>>> Image.MAX_IMAGE_PIXELS = 1000000000
>>> im = Image.open(r'some.jpf')
但是,对于解压后的数据显然大于当前物理内存的图片,应当灵活应用图片压缩方法具备的特性,例如JPEG的递进性(即Progressive)、JPEG 2000的区域解码(即Random Access)等等。然而这些特性,PIL几乎不能使用,因此应当考虑其他专业软件或者根据需求自行实现。
也许对于具有极大物理内存的用户来说,通过调整阈值,图像尺寸似乎就没有了上限。但事实上考虑到Python令人遗憾的多核性能(至少对于cPython),以及一个平凡的观察——你通常需要处理很多小图片,或者些许大图片——加载一个特别大的图片将不会在合理的时间内完成,即使通过并行处理也节约不了太多时间(并没有那么多图片需要处理)。
出现的实际情况
openslide.open_slide("xxx.ndpi")时会出现这个问题。
解决方法
第一种(我使用的)
from PIL import Image
Image.MAX_IMAGE_PIXELS = 2300000000
第二种
from PIL import ImageFile, Image
ImageFile.LOAD_TRUNCATED_IMAGES = True
Image.MAX_IMAGE_PIXELS = None