随笔

一、数字图像处理 Digital image processing

1、简要介绍

(1)定义:输入一张图像,经过一些处理(抠图、分割、降噪、风格迁移、拼接、修复等),输出另一张图像(从二维到二维之间的变化)

(2)常用的色彩空间:RGB、CMYK(一般用于印刷)、HSV(色调H,饱和度S,亮度V)

(3)一些英文术语:

降噪 image denoise

抠图 image matting:调整不确定区域α的值

分割 image segmentation:

拼接 image stitching:骑自行车的场景

修复 image inpainting/restoration:修复图像上的缝隙

变形 image morphing:换脸

风格迁移 image style migration:用梵高风格绘制图像

合成 image synthesis:用语义画笔绘制风景图

2、几个重要的思想

(1)分而治之

(2)系统性:输入、过程、输出

(3)对比:找出与别的算法更优的一个方面即可

3、其他

在写论文的时候或者做报告的时候先要把问题介绍清楚

二、计算机图形学Graphics

图形学三大会议:美国图形学联会、欧洲图形学联会、中国图形学联会

表示3D的方法:样条曲线曲面、mesh网格:点+三角面

1、简要介绍

(1)WHAT:将三维图像经过一些步骤变成二维图像,具体的步骤为:建模、绘制、动画与仿真、交互

(a)建模Modeling

用数字形式表示对象,主要有三种方式:交互式建模(借助软件,如max、maya、犀牛、zbrush)、3D扫描(借助仪器)、基于图像建模(借助图像)

建好模型之后通过纹理映射(Texture mapping)进行贴图

(b)绘制Rendering(渲染)

WHAT:光与物体的交互作用,主要与以下因素有关:光源、物体的材质、光源与物体的交互(漫反射、镜面反射、亚表面反射、折射)

WAY:第一种方法是光栅化:将几何信息转换成一个个的栅格组成的图像的过程;第二种方法是光线追踪ray tracing,与第一种方法是相反的过程。

(c)动画Animation

蒙皮骨骼

(d)交互Interaction

(2)计算机图形学的发展追求的指标2R

实时性 real-time和真实感 real-reality

(3)图形绘制流水线

顶点处理(可编程的)->组装->光栅化->片元处理(可编程的)

2、VR/AR/MR

(1)VR虚拟现实

3I特性:沉浸式immersive、交互式、想象imagination

眼镜:一体式、连电脑的、放手机的

(2)AR增强现实augmented

(3)MR混合现实

3、其他

GPU:graph process unit

WebGL:优点:方便、不用下载,缺点:初始加载很慢

三、计算机视觉(Computer Vision)

1、常用的找图片素材的平台有:behance、花瓣网、picsearch等

2、WHAT:从图像和视频中寻找信息、理解含义

3、GOAL:提取信息,主要分为两种:一种是可度量3D信息,另一种是语义信息。

前者:深度图像(带有深度值的图像,即RGBD),通常用灰度图(0黑~255白)表示深度信息

主要过程:特征提取->特征匹配->求取相机参数(内参(曝光度等)和外参(相机的位置、朝向等))->得到三维信息(即深度图像)可以重构模型

后者:主要是理解图像的语义信息(比如这个图像是个树或者是个人等)

4、区分识别和鉴定

识别:是张脸

鉴定:是你的脸

5、平滑的过程

例如 均值滤波(每n个取平均值来代替,通过滑动窗口)、中值滤波(每n个取中间的值来代替)、高斯滤波

6、HoG梯度统计直方图

7、监督学习与无监督学习

监督学习:数据集是已经打好标签的,训练过程直接根据数据集进行训练学习

无监督学习:数据集没有打标签,训练过程是模型通过聚类等算法自己进行训练学习,把具有相同特征的目标聚在一起

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值