左:原始图像,右:使用Augly(作者创建的图像)增强后
Facebook最近发布了[1]一个增强库Augly,它结合了多种数据(音频、图像、视频和文本)。
数据扩充是增加标记训练数据的大小和多样性的常用技术,这也有助于建立稳健的模型。
这里我只关注我在图像上测试的几个增强函数,但是这个库也可以用于文本和音频。
Augly更致力于社交媒体平台的变革,包括Facebook。因此,除了通常的裁剪、翻转外,其他增强功能还包括对图像/视频共享平台所做的非常逼真的转换,如叠加图像、表情符号、文本等。
根据Facebook新闻稿,其中一个主要的重要应用是:
检测特定内容的精确副本或近似副本。
例如,同一条错误信息可能以稍有不同的形式重复出现,例如,图像被裁剪了几个像素,或者被过滤器或新文本覆盖而增强。通过向人工智能模型添加大量数据,他们可以学会发现某人何时上传已知侵权内容,如歌曲或视频。
Augly的开发目的是通过转换(“增强”)数据来阻止人们逃避自动检测系统,同时,该库也用于评估deepfake检测模型。
使用Augly进行图像增强:
下面是我用来测试Augly中图像的一些增强函数的几个工作示例。要在Colab中尝试这一点,首先,我们需要安装Libmagic和Augly
!pip install augly
!apt-get install libmagic-de