Facebook推出图像增强库：Augly

最新推荐文章于 2024-04-25 09:35:45 发布

小白学视觉

最新推荐文章于 2024-04-25 09:35:45 发布

阅读量131

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzU0NjgzMDIxMQ==&mid=2247604741&idx=4&sn=9f64b60bd375211765616c5779d82d74&chksm=fb54b8e9cc2331ffd2ef79a6a0c63a813d34495bb45e3d6e84fa55686dd00eefa4502ad21f80&scene=126&sessionid=0

版权

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

左：原始图像，右：使用Augly（作者创建的图像）增强后

Facebook最近发布了[1]一个增强库Augly，它结合了多种数据（音频、图像、视频和文本）。

数据扩充是增加标记训练数据的大小和多样性的常用技术，这也有助于建立稳健的模型。

这里我只关注我在图像上测试的几个增强函数，但是这个库也可以用于文本和音频。

Augly更致力于社交媒体平台的变革，包括Facebook。因此，除了通常的裁剪、翻转外，其他增强功能还包括对图像/视频共享平台所做的非常逼真的转换，如叠加图像、表情符号、文本等。

根据Facebook新闻稿，其中一个主要的重要应用是：

检测特定内容的精确副本或近似副本。

例如，同一条错误信息可能以稍有不同的形式重复出现，例如，图像被裁剪了几个像素，或者被过滤器或新文本覆盖而增强。通过向人工智能模型添加大量数据，他们可以学会发现某人何时上传已知侵权内容，如歌曲或视频。

Augly的开发目的是通过转换（“增强”）数据来阻止人们逃避自动检测系统，同时，该库也用于评估deepfake检测模型。

使用Augly进行图像增强：

下面是我用来测试Augly中图像的一些增强函数的几个工作示例。要在Colab中尝试这一点，首先，我们需要安装Libmagic和Augly

!pip install augly

!apt-get install libmagic-dev

!pip install python-magic

import augly.image as imaugs

现在，我们已经准备好使用Augly，但在此之前，我们需要加载一个示例图像。让我们这样做

from skimage import data

camera = data.astronaut()

因为Augly使用PIL格式，所以让我们对其进行转换-

from PIL import Image

camera_pil = Image.fromarray(camera)

camera_pil.show()

图1：使用Skipage加载的原始图像：

这是我们的原始图像。顺便说一下，她叫艾琳·柯林斯，1992年被选为宇航员，1995年首次驾驶STS-63号航天飞机。

首先，让我们从一些相对简单的增强函数开始，比如改变透视图

aug_perspective = imaugs.PerspectiveTransform(sigma=20.0)

camera_pil_perspective = aug_perspective(camera_pil)

camera_pil_perspective.show()

图1的透视变换：

这里 sigma 指的是目标坐标分布的标准差， sigma 值越高，转换越强烈。

我们还可以随机更改纵横比，如下所示-

aug_aspect = imaugs.RandomAspectRatio()

camera_pil_aspect = aug_aspect(camera_pil)

camera_pil_aspect.show()

在图1上随机改变纵横比：

我们还可以通过添加一些饱和度来增强图像

aug_saturation = imaugs.Saturation(factor=5.0)

camera_pil_sat = aug_saturation(camera_pil)

camera_pil_sat.show()

增加图1中原始图像的饱和度：

现在，让我们来看一些可以使用Augly添加的独特转换。首先，我尝试覆盖条纹，变换后的图像如下所示

在原始图1上覆盖条纹：

用于上述转换的代码是

camera_pil_overlay_stripes = imaugs.overlay_stripes(camera_pil, line_type=’dashed’, line_opacity=0.5, line_color=(120, 0, 200), line_angle=25.0)

camera_pil_overlay_stripes.show()

叠加文本怎么样？这也是可能的

将文本覆盖在原始图1上：

我们还可以添加表情符号-

camera_pil_overlay_emoji = imaugs.overlay_emoji(camera_pil)

camera_pil_overlay_emoji.show()

将表情符号叠加在原始图1上：

我们还可以变换图像，使其看起来像Instagram上的屏幕截图

将Instagram屏幕快照覆盖在原始图1上：

代码块如下所示

import os

import augly.utils as utils

aug_overlay = imaugs.OverlayOntoScreenshot(template_filepath=os.path.join(utils.SCREENSHOT_TEMPLATES_DIR, “mobile.png”))

camera_pil_overlay = aug_overlay(camera_pil)

camera_pil_overlay.show()

通过将覆盖图像mobile.png更改为web.png，我们可以获得另一个转换

将Instagram网页的屏幕截图覆盖在原始图1上：

我个人认为，这些转换非常酷，正如Facebook在新闻稿中提到的，它们旨在理解人类与社交媒体的互动。我相信对语音和语言处理感兴趣的人也会发现这个库非常有用。

感谢Facebook使这个库开源，感谢Joanna Bitton&Zoe Papkipos，我相信他们是这个项目背后的主要智囊。

好消息！

小白学视觉知识星球

开始面向外开放啦👇👇👇

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2：Python视觉实战项目52讲
在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。


下载3：OpenCV实战项目20讲
在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

小白学视觉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Facebook推出图像增强库：Augly

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达左：原始图像，右：使用Augly（作者创建的图像）增强后Facebook最近发布了[1]一个增强库Augly，它结合了多种数据（音频、图像、视频和文本）。数据扩充是增加标记训练数据的大小和多样性的常用技术，这也有助于建立稳健的模型。这里我只关注我在图像上测试的几个增强函数，但是这个库也可以用于文本和音频。Augly更致力于社交媒...
复制链接

扫一扫