对人类来说,将带有文字的图像锐化是很容易的。以图1为例。
图1:被锐化的图像
把图1恢复为图2也不是件很困难的事。
图2:原图
然而,我们是懒惰的,并且不想这样做,所以我们尝试用神经网络来自动实现图片的不模糊化!
发展
得到被模糊的文本的实图和它们的不模糊的副本是不容易的,因此在时间的兴趣中产生了一个训练集。生成文本图像并将它用计算机软件进行模糊处理是很简单的,一个python脚本利用PIL(python图片库)就可以完成。训练集的大小可以储存10.000张图片。训练集的例子可以在图3中找到。
图3:训练集的例子。上一行显示输入图像,而下一行显示输出目标。
让Fθ成为不模糊图像神经网络,Y1,Y2,…,Yn成为图像,然后X1,X2,…,Xn作为模糊的副本。我们为神经网络找到参数θ,该神经网络最小化了每个图像的每个像素的均方差。
为了解决这一问题,我们尝试了两种Fθ的架构。然而,它们都是某种形式的卷积神经网络。
第一个架构尝试的是一些卷积层,它们具有相同的输入和输出维度,也就是说,当在tf.conv2d函数中填充 “SAME”设置时,才会得到结果。然而,中间层的通道数量并不是固定的。在层间,除了最后一层使用的是一个被激活的正常的ReLU,LeakyReLU被用