- 图像分类指的是 根据图片来划分图像的类别 。
- 例如:根据图片识别图片中人物的性别为男还是女。
- 如下图很清楚地就可以看出,物体检测和识别通常是将物体在原图像上框出,可以说是“宏观”上的物体,而 语义分割是从每一个像素上进行分类,图像中的每一个像素都有属于自己的类别。
- 目标检测对于人类来说并不困难,通过对图片中不同颜色模块的感知很容易定位并分类出其中目标物体,但对于计算机来说,面对的是 RGB 像素矩阵,很难从图像中直接得到狗和猫这样的抽象概念并定位其位置,再加上有时候多个物体和杂乱的背景混杂在一起,目标检测更加困难。
- 但这难不倒科学家们,在传统视觉领域,目标检测就是一个非常热门的研究方向,一些特定目标的检测,比如人脸检测和行人检测已经有非常成熟的技术了。
- 如下图,不仅要识别出图片类别,还用方框将猫的位置标注出来,(即图片分类+定位)。
- 神经风格迁移是指: 将参考图像的风格应用于目标图像,同时保留目标图像的内容。
- 通常,将艺术家的画作为风格图像,这样就能够让计算机画出指定艺术家风格的画。
- 训练一个判别网络与一个生成网络,通过对两者不断的对抗训练,最后 判别网络 能够准确的识别真实图像与生成图像,而 生成网络 能够生成非常逼真的图像,
- 如下图,每组图像左边为真实图片,右边为生成图片。