[自学记录09*]探究降采样顺序对模糊性能优化的影响

一、降采样在模糊中的优化

这两天接手了几个高度定制化的模糊,包括不限于放射和旋转状的径向模糊,移轴模糊,景深的散景模糊等等,这些效果在游戏中非常常见。

其实模糊的原理都差不多,无非就是对UV偏移后重新采样再求平均。

这里面最费的自然是对整张屏幕的RT采样。询问了一圈,貌似如果在低端机上采样8次就已经算非常非常高了。

那就不得不搬出一个常见的优化手段,那就是降采样。

关于降采样还有一点,在径向模糊,景深等效果中,并不是使整个屏幕的画面全部模糊,一般来说会有一段距离/一个区域是保持清晰的。(如角色释放技能,以击中点为圆心的四周一定半径范围内都是清晰的,而超出范围距离越多模糊越强烈)。

如果单纯的降采样,周围模糊的区域分辨率低又模糊了不会产生太大影响。但中间清晰的区域被降采样之后,效果会有很大折扣,这个折扣会随降采样次数增加。

所以常见的办法是渲染一张原图,再渲染一张降采样的模糊图,然后用模糊强度(以景深为例,模糊强度的插值因子就是那张做了step得到的焦距深度图)去和原图进行插值。这样没有模糊的地方就是没有被降采样的地方,效果不会变,而模糊的地方即使降采样了也不会很影响。

1.测试

由于测试机器是3060ti,加上场景压力不大,所以参数调的变态一点,先不降采样,分辨率调成4K,模糊采样2000次,可以看到,平均FPS只有10。

(1) 2 Pass,插值,无降采样,采样次数:2000

该场景分为2个Pass,先渲染一遍原分辨率的原图,然后对原图进行模糊,接着在原图和模糊的图之间进行插值。可以说是最耗,且最没有意义的测试了,因为如果不降采样没必要去多申请一张纹理再插值,当然,这部分我们后面再说。

979a5e4522888663f8c233c20f11527b.png

(2) 2 Pass,插值,降采样/8,采样次数:2000

OK,我们还是用刚才的场景,这次我们开启降采样,调为8,其它参数不变,让我们来看看。

59d29a7e3665f673211091bf0f037be2.png

FPS涨幅非常夸张,翻了40倍。当然,因为降采样/8,采样的纹理大小是原来的64分之一,也就是比原来可以多采63张图。当然这里的涨幅这么变态的原因可能是因为瓶颈就是采样次数,因为场景本身复杂度并不高。在实际项目中可能不会有如此夸张的涨幅。

还有一点,两张图的效果明显差距很大,这是降采样带来的画面折扣,但其实不用太担心,因为我们的采样次数是2000,所以才会出现这种情况,在16采样的情况下,其实两幅画面差距不是特别明显,如下两幅图所示。

218deeef6fbb17362dbc700bf06c60d9.png

16次RT采样,降采样/8

37ab91f649fd88259914a09d819d6115.png

16次RT采样,无降采样

某种意义上来说,降采样参数完全可以当模糊半径参数使用了。反正对清晰的部分没有影响。

二、先降采样再模糊or先模糊再降采样

1.DOF测试

我们前面的操作的顺序是这样的:

  1. 先把相机存储在一张降了分辨率的RT上。

  2. 对该降了分辨率的RT进行模糊

  3. 把该RT和相机之间插值,返回相机。

在自己亲手操刀之前查过一些资料,他们有些的顺序是这样:

  1. 先把相机以原分辨率存到一张RT上

  2. 把该RT模糊,然后存到一张降采样RT上

  3. 把降采样并且模糊了的RT和原分辨率的RT插值

  4. 返回相机

中间一些申请纹理等等操作当然可以优化的更简练一些。

但这不是重点,而是先模糊还是先降采样这个问题。我们在一、中做的实验的顺序是先降采样再模糊,所以帧数涨的才这么多,但是如果按照网上的一些资料先模糊再降采样呢?

f9708b7160c35cb08e508cefaf0b7ace.png

其他参数都不变,仍然是4K分辨率,2000次采样,降采样/8,2 Pass,插值。

唯一区别是这次是先模糊,再降采样。可以看到,是有“提升”的,从10帧到50帧,但这是提升吗?别忘了我们最初的最初在没考虑优化和效果的时候 1个 Pass就可以完成这个效果,而10FPS那个场景是有不必要的申请纹理和插值的消耗的,所以那个结果不应该拿来和这个对比。

我们重新写一个DOF的景深效果,这次我们不考虑任何优化的事情,1个Pass,4K分辨率,插值,不降采样。

0214228c8554df017d8b92c1435fb73d.png

可以看到,换成单Pass以后从10FPS变到了12FPS,提升2%左右,很好想,既然怎么弄都要插值,那最后采样的模糊图肯定越小越好,那也就很好想了。

先降采样再模糊:这种顺序会节省模糊操作的消耗,同时也会节省插值前采样模糊图的消耗。

先模糊再降采样:这种顺序只是单纯的节省了插值前采样模糊图的消耗。

但是这里仍然有一个问题,那就是DOF这个效果的特殊性,这个东西无论做成单Pass还是双Pass都需要用那张深度去插值,所以实际上插值的操作我们并没有省掉,我们换一个效果继续测试,这次我们换成放射状的径向模糊。

2.径向模糊测试

首先,先看一下,单Pass,无插值,采样2000次,无降采样。大概15,16FPS这样子。

1457c042d73f12e172341819cdfaedab.png

单Pass,无插值,采样2000次,无降采样

然后是,双Pass,插值,采样2000次,降采样8次,先降采样再模糊。大概400FPS。

464e6ba4285f25d6aeca54f790481c14.png

双Pass,插值,采样2000次,降采样8次,先降采样再模糊

最后,双Pass,插值,采样2000次,降采样8次,先模糊再降采样。大概100FPS。

c96e333d46e12db28ca5ae76cfd1ff09.png

双Pass,插值,采样2000次,降采样8次,先模糊再降采样

可以看到,与我们前面的猜测差不多。

三、结论

  1. 无论降采样的顺序如何,它都会降低开销

  2. 先模糊再降采样降低消耗相对来说较少,因为它只节省了插值那步采样的消耗

  3. 先降采样再模糊降低消耗相对来说较多,因为它节省的是每次模糊的采样消耗,采样循环次数越多,节省越明显。

由于本人刚刚开始实习,这也算是开始工作进入项目后负责的第二个问题吧,研究了两三天,写出这篇测试小实验的文章分享一下自己的小发现,大佬就当看个乐就得了,也主要是记录使用。总之研究完之后感悟还挺身的吧,在项目中的工作心态和之前自己写demo的心态也完全不一样,希望未来能赶上前辈们的脚步,共勉。

  • 19
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值