阅读笔记2:董超底层视觉之美|底层视觉是什么?

原文链接:https://mp.weixin.qq.com/s/9EQNwXqCM6odwe5n9dOrmw

本文针对底层视觉给出了一个大致的定义,然后通过底层视觉与人工智能、计算机视觉、图像处理等相关概念的对比来对底层视觉做了进一步的界定。

1. 底层视觉是什么

  • 以像素级图像为输入、处理和输出单元的计算机视觉问题

    底层视觉是以像素级的图像为输入、处理和输出单元的计算机视觉,它将图像从原始信号或某种观测状态转换成人们想要看到的样子,通常是清晰的自然图像

  • 底层视觉包含哪些任务?

    底层视觉所包含的任务主要有图像和视频的去噪、增强、复原、压缩、HDR、超分辨率等,还有一些处于模糊地带的任务如图像风格化、图像生成等。这些任务之间也存在一些交叉和融合,比如去噪、去压缩和超分辨率可以同时进行,也可以合成一个任务来研究。
    在这里插入图片描述

2. 底层视觉与计算机视觉

按照语义抽象程度,计算机视觉可以分为以下三类:
在这里插入图片描述

另外,图像生成任务是在上面三种任务之外的,他不是将图像进行理解或转换,而是根据抽象的信息(如文字或噪声)生成具体的图像。

3. 底层视觉与人工智能

以“老电影复原”这个底层视觉任务为例,分析是否符合人工智能的四个原则。
人工智能四个原则:

  1. 人工智能是一种解决复杂问题的算法。
  2. 人工智能可以实现复杂的目标。
  3. 人工智能具备从数据中学习的能力。
  4. 人工智能要与人类主观意识进行互通。

“老电影复原”任务中分别与上面四个原则对应的特点:

  1. 该任务“过程不可逆”、“解不唯一”,是一个复杂的问题;
  2. 老电影复原是一个复杂的目标,它包含多个子目标或子任务,如去噪、去模糊、去压缩伪影、超分辨率、插帧、上色、增强等。
  3. 需要大量数据进行训练
  4. 老电影复原的终极目标是要提升人眼的主观感受.

4. 底层视觉与图像处理

“底层视觉关注的是任务,而图像处理关注的是工具。”
“我们看到经典的图像处理教材会包含大量的工具性算法,是所有图像相关研究的基础。而底层视觉的教材会以任务为导向,讲述每个任务的定义、评价和方法。

早期的底层视觉算法都是用的图像处理工具,比如边缘提取算子、奈奎斯特采样、统计直方图、傅里叶变换等。进入深度学习时代后,底层视觉全面采用深度学习方法,只保留了一些基本的图像处理操作(如图像拼接和色彩空间转换),而将绝大部分计算放到了网络模型当中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值