快手图像视频算法工程师面试准备

本文详细介绍了ks图像视频算法工程师面试的关键知识点,包括图像质量评价指标的分类和计算方法,图像超分辨率的传统与深度学习方法,优化器的作用及常见类型如梯度下降、动量优化和自适应学习率优化器,以及卷积和池化的基本概念。此外,还探讨了图像增强、伪影处理、直方图均衡化和GAN(生成对抗网络)等核心概念。
摘要由CSDN通过智能技术生成

1.图像质量评判指标有哪些

1.1 根据评价指标是否参考原始图像分为

1.1.1 全参考评价指标(MSE,MAE,SNR,PSNR,IFC,VIF,SSIM等)

​编辑

1.1.2 半参考评价指标

1.1.3 无参考评价指标(均值,标准差,平均梯度,熵)

1.2 根据评价的标准是依据人的主观观察还是客观标准分为

2.图像超分都有什么方法

2.1 传统方法

2.1.1插值方法

2.1.2 基于稀疏表示(字典学习)的方法

2.2 深度学习方法

2.2.1 SRCNN

3.图像增强都有什么方法 传统方法 深度学习的方法

4.各种优化器

4.1 优化器有什么用?调整模型参数到一个值使Loss最小

4.2 梯度下降法

4.3 动量优化法

4.4 自适应学习率优化法

4.4.1 AdaGrad(自适应梯度)

 4.4.2 RMSProp

4.4.3 Adam

4.5 总结

(1) Batch Gradient Descent (BGD)

(2) Stochastic Gradient Descent (SGD)

(3)Mini-batch Gradient Descent (MBGD)优点:

(4)Adam (Adaptive Moment Estimation)优点:

5.什么是卷积

6.什么是池化

池化的意义在于特征降维,池化技术大大降低了对于计算资源的损耗,除此以外还有降低模型过拟合的优点

7.图像的伪影如何解决

9.什么是GAN?


1.图像质量评判指标有哪些

图像质量评估各项指标(一)_有参考图像质量评价指标-CSDN博客

1.1 根据评价指标是否参考原始图像分为

1.1.1 全参考评价指标(MSE,MAE,SNR,PSNR,IFC,VIF,SSIM等)

基于图像像素统计基础,峰值信噪比(Peak-Signal to Noise Ratio,PSNR)和均方误差(Mean Square Error,MSE),还有MAE(Mean Absolute Error,MSE)和信噪比SNR(Signal to Noise Ratio),是比较常见的几种质量评价方法。它们通过计算待评测图像和参考图像对应像素点灰度值之间的差异,从统计角度来衡量待评图像的质量优劣。

PSNR与MSE都是通过计算待评图像与参考图像之间像素误差的全局大小来衡量图像质量好坏的。PSNR值越大,表明待评图像与参考图像之间的失真较小,图像质量较好。而MSE的值越小,表明图像质量越好。这两种方法比较简单,且容易实现,在图像去噪等方面受到广泛应用。但这类算法是从图像像素值的全局统计出发,未考虑人眼的局部视觉因素,所以对于图像局部质量无从把握。

图像质量评估各项指标(二)——结构相似性SSIM_ssim能否用于评估两个颜色饱和度是否相似?-CSDN博客

SSIM的基本思路是,通过以下三个方面来对两幅图像的相似性进行评估,即

1. luminance,亮度
2. contrast,对比度
3. structure,结构

基本流程为:

(1)对于输入的x和y,首先计算出(亮度测量)luminance measurement,进行比对,得到第一个相似性有关的评价;

(2)再减去luminance的影响,计算(对比度测量)contrast measurement,比对,得到第二个评价;

(3)再用上一步的结果除掉对比度的影响,再进行structure的比对。最后将结果combine,得到最终的评价结果。

1.1.2 半参考评价指标

1.1.3 无参考评价指标(均值,标准差,平均梯度,熵)

无参考方法也称为首评价方法,因为一般的理想图像很难获得,所以这种完全脱离了对理想参考图像依赖的质量评价方法应用较为广泛。无参考方法一般都是基于图像统计特性。

1.2 根据评价的标准是依据人的主观观察还是客观标准分为

主观评价指标

客观评价指标

2.图像超分都有什么方法

2.1 传统方法

2.1.1插值方法

最常用的插值方法包括bilinear、bicubic、lanczos、nearest等,这些图像重构(超分辨)方法都只使用低分辨率图像自身的像素信息,而且每一个位置的像素点都是基于该像素周围的信息进行插值的,所以重构图像都是非常模糊的。重构的PSNR/SSIM为28.626/0.775,这个值是比较低的,图像是很模糊的。

2.1.2 基于稀疏表示(字典学习)的方法

2.2 深度学习方法

2.2.1 SRCNN

网络如上图所示,包含三层卷积。分别叫 Patch extraction and representation(块析出与表示)、Non-linear mapping(非线性映射)、Reconstruction(重构)

Patch extraction and representation:对输入图像进行特征提取,卷积+ReLU,ks=9 x 9

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值