高斯模糊的细枝末节

最新推荐文章于 2024-07-20 04:00:00 发布

置顶 konglingbin66

最新推荐文章于 2024-07-20 04:00:00 发布

阅读量1.4k

点赞数

分类专栏： U3D 文章标签：概率论高斯模糊正态分布屏幕后处理

本文链接：https://blog.csdn.net/konglingbin66/article/details/127684738

版权

U3D 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1.概述

高斯模糊是非常常见的一种图像模糊方式，简单说就是将每个像素点和周围像素点，以某种方式进行混合, 实现既不改变原图的大致形态，看上去还是原来的样子，但却模糊了的效果，如图1-1所示. 查阅很多资料，发现大多数都是对高斯模糊侃侃而谈，但是没有讲到数学计算的细节，算子到底是如何得到的. 高斯模糊涉及到了数学概率的正态分布，有一点点的复杂度. 在此我们就是要从“0”开始说清楚这个高斯模糊的来龙去脉，前世今生.

2.数学推导

2-1正态分布

图2-1是人类的智商分布比例，大多数人的智商集中在85-115，超高和超低智商的人只占很小的比例，柱状图可用一条曲线拟合，如图中红色曲线所示. 这个钟形曲线就是正态分布曲线. 正态分布曲线体现了宇宙中很多事物的分布规律，比如全国身高的分布，年级考试成绩的分布，气体分子运动速度的分布，抛10个硬币1000次正面向上的次数分布，等等都符合正态分布.

2-2 正态分布试验

正态分布，可描述某事件大量发生时的分布规律，或某事件单独发生的可能性，也就是概率. 事件发生后，可用统计解释，发生前可用概率预测. 图2-2的装置叫做高尔顿钉板，可验证大量重复试验的结果符合正态分布. 小球从顶部落下，会经过很多钉子，每碰到一个钉子，小球弹向左边或右边的概率都是1/2，落在最左边或者最右边的概率非常低，落在中间的概率最高，所以可以用正态分布描述小球落入区间的分布.

2-3 正态分布的数学描述

正态分布用数学公式表达就是

曲线表示概率密度变化，x轴数值表示试验结果，函数值是这个结果对应的概率, 比如某人智商是x=130的概率是f(x),或者说人类中智商是x=130的所占的比例是𝑓𝑥.. 曲线积分（曲线和x轴围成的面积）等于1，即所有可能的情况（x的取值值）的概率和（求积分）是1，比如某人的智商是

x∈[0-150]（全部可能性）的概率是1.

𝑥=μ，对应钟形曲线最高点，μ是x的概率加权平均值，叫期望E(X)，期望就是平均值，比如智商统计的曲线中μ=100,那么人类的平均智商就是100. μ=0时，平均值就是0，如图.小明和小红的智商是90和110，平均值是：(90+110)/2=100

𝜎2σ^2的平方是方差，即

即所有x与平均值的差，平方，求和，最后平均. 方差表示样本的平均波动大小，比如小明和小红的智商是90和110，平均值是100，方差是[(90-100)^2+(110-100)^2 ]/2=100，再比如小明和小红的智商是50和150，平均值也是100，但是方差（波动性）要大得多， [(50-100)^2+(150-100)^2 ]/2=2500

2-4 从正态分布到高斯模糊

图像的模糊算法有很多，比如有：

均值模糊：将中心像素和周围像素颜色数值加起来求平均，作为中心像素的模糊结果

中值模糊：把中心像素和周围像素的颜色排个顺序，取中间像素的颜色数值作为模糊结果

高斯模糊：中间像素和周围像素对模糊的权重（重要性）不一样，且权重遵循正态分布，进行加权平均. 换句话说，高斯模糊就是参与模糊的像素（中间像素和周围像素）的重要性，符合正态分布，所以按照正态分布的规律加权平均就是最后的模糊数值，中间像素权重（百分比）最大，越往边上，权重（百分比）越小，且所有的权重（百分比）的和应该是1，即100%. 正态分布又叫做高斯分布，所以这种模糊又叫高斯模糊. 中间像素的权重最大，对应钟形曲线最高点，左右像素的权重对称相等，所以𝜇μ=0 ，曲线关于y轴对称；𝜎σ决定了曲线的陡峭程度，𝜎=1σ=1的曲线相对平滑，那么模糊也会相对平滑. 高斯模糊的像素权重分布，采用的正态分布函数如下：

2-5 采样计算

正态分布是连续的，纹理采样点是离散问题有限的，对于每个纹素，不可能采样整张图像，按照正态分布加权平均，最后生成该纹素点的模糊值. 出于效率考虑，假设在目标纹素左右，以Δx为间隔，各采样2个点，包括中心的目标纹素共5个点，如图2-5. 那么应该将这5个点，映射在正态分布多大的范围内，来取得权重呢？正态分布的样本空间是[-∞,+∞], 在图2-5中，当 x∈[μ-2σ,μ+2σ] 时，概率（权重）总和已经达到95%, 接近100%，再靠边缘的样本对最后结果的贡献非常非常小，所以仅需要在正态分布的[μ-2σ,μ+2σ]区间中计算权重即可.

当分布函数为

即μ=0，σ=1时，区间-2,+2]权重占到95%. 那么5个纹理采样点，映射到正态分布的区间[-2,+2]上，得到正态分布曲线的x值为-2，-1，0，1，2，得到5个纹理采样点对应的5个权重值，或者说这5个纹素对于目标纹素点模糊的贡献比例为：

但这些权重加起来不是1，而是

在[-2,+2]区间，权重总和不是应该占95%吗，怎么是99%呢？这是因为，这个95%是积分计算的结果，而此处的结果是离散数据计算的.如图2-5-2

2-6 二维高斯模糊

图像是二维的，那么模糊权重也应该是二维的，所以将正态分布从一维扩展到二维，公式为：

3D 图像如图2-6所示. 二维的高斯算子，是x,y两个参数共同决定的, 离远点越近，权重值越大. 如果在目标纹素周围5*5的范围采样，需要把这25个纹素采样点映射到x∈[-2,+2],y∈[-2,+2]的区间内的25个（x,y）坐标，计算得到25个权重，再对25个纹理采样颜色分别乘以权重，得到加权求平均值，即最终的高斯模糊颜色，如图2-7所示.

2-7 简化二维采样

如果一张图像的尺寸是w*h，上述二维高斯核需要25*w*h次采样并计算，如何才能降低计算成本，又不必大幅度损失效果呢？可以简化采样方式，采用2个方向的一维高斯核采样，如图2-8，这样仅需要5*w*h+5*w*h次采样，垂直水平方向分别进行一次高斯模糊的计算，既提高了效率，又不至于效果太差. 后续的代码实现中也将采用这种简化的二维高斯核计算权重. 注意，此处的一维权重是使用图2-5中的归一化的一维权重，因为此时是用2个方向的一维权重（不是二维权重图中9/25的那些部分），分别执行一次独立运算（但效果是叠加的）.

3.代码部分

3-1 程序思路

高斯模糊的实现分成两个部分，c#和shader. 因为这是一种图像后处理，意思就是先要渲染场景，等到场景渲染结束，变成一张纹理（图像），然后再对这张图象进行处理. 场景渲染结束后会调用我们的c#函数，该函数再调用shader中的pass，进行真正的模糊处理. 因为pass是用GPU计算的，速度不是一个等级，这也是调来调去的原因所在.

具体到实现中，此处使用Unity提供的C#接口：

MonoBehaviour.OnRenderImage(RenderTextrue src,RenderTextrue dest)

该函数需要在继承MonoBehaviour的脚本中定义，并且必须将脚本绑定到摄像机. OnRenderImage函数会在所有不透明和透明Pass执行完毕后调用. 如果希望不透明Pass(即渲染你队列<=2500的Pass，包括内置Background,Geometry,AlphaTest)执行完毕立刻调用函数，可在函数定义中加[ImageEffectOpaque]特性来实现.

屏幕图像将传入OnRenderImage的参数src，再通过Graphics.Blit函数调用特定Shader来处理，再把处理的结果放在dest参数中，最后显示到屏幕上, 在一些复杂的屏幕特效中，可能会多次调用Graphics.Blit函数.调用过程如图3-1

using UnityEngine;

[ExecuteInEditMode]//编辑模式也可以看到效果
[RequireComponent(typeof(Camera))]//只能绑定到有Camera脚本的GameObject上
public class GuassBlur : MonoBehaviour
{
	public Shader edgeDetectShader; //调用的材质球
	private Material edgeDetectMaterial = null;//该材质球动态生成

	//高斯模糊的迭代次数，次数越大越模糊.
	[Range(0, 4)]
	public int iterations = 3;
	//模糊范围，每次模糊处理的采样范围为  1+ 迭代次数 * blurSpread
	[Range(0.2f, 3.0f)]
	public float blurSpread = 0.6f;
	//降采样数，图像尺寸变为原来的（1/downSample，1/downSample）进行模糊,降低太多容易有马赛克感
	[Range(1, 8)]
	public int downSample = 2;
	public Material material
	{
		get
		{
			edgeDetectMaterial = CheckShaderAndCreateMaterial(edgeDetectShader, edgeDetectMaterial);
			return edgeDetectMaterial;
		}
	}
	void OnRenderImage(RenderTexture src, RenderTexture dest)
	{
		if (material != null)
		{
			//计算过降低后的图像尺寸
			int rtW = src.width / downSample;
			int rtH = src.height / downSample;
			//new缓存
			RenderTexture buffer0 = RenderTexture.GetTemporary(rtW, rtH, 0);
			//原图像和降采样后图像之间使用双线性滤波转换，本身也会带来一定的模糊效果
			buffer0.filterMode = FilterMode.Bilinear;
			//原图-> 小图
			Graphics.Blit(src, buffer0);
			//进行iterations次高斯模糊处理
			for (int i = 0; i < iterations; i++)
			{
				//设置采样间隔
				material.SetFloat("_BlurSize", 1.0f + i * blurSpread);
				RenderTexture buffer1 = RenderTexture.GetTemporary(rtW, rtH, 0);

				//调用第0个pass，进行垂直方向的高斯模糊
				Graphics.Blit(buffer0, buffer1, material, 0);

				RenderTexture.ReleaseTemporary(buffer0);
				buffer0 = buffer1;
				buffer1 = RenderTexture.GetTemporary(rtW, rtH, 0);

				//调用第1个pass，进行垂直方向的高斯模糊
				Graphics.Blit(buffer0, buffer1, material, 1);

				RenderTexture.ReleaseTemporary(buffer0);
				buffer0 = buffer1;
			}
			//高斯模糊的小图 ->  大图
			Graphics.Blit(buffer0, dest);
			RenderTexture.ReleaseTemporary(buffer0);
		}
		else
		{
			Graphics.Blit(src, dest);
		}
	}
	//检查、生成、返回材质球
	protected Material CheckShaderAndCreateMaterial(Shader shader, Material material)
	{
		if (shader == null)
		{
			return null;
		}
		if (shader.isSupported && material && material.shader == shader)
			return material;
		if (!shader.isSupported)
		{
			return null;
		}
		else
		{
			material = new Material(shader);
			material.hideFlags = HideFlags.DontSave;
			if (material)
				return material;
			else
				return null;
		}
	}
}

3-2 C#部分

3-3 shader部分

Shader "MyShader/PostEffect/GuassBlur" {
	Properties{
		_MainTex("Base (RGB)", 2D) = "white" {}
		_BlurSize("Blur Size", Float) = 1.0
	}
		SubShader{
			CGINCLUDE

			#include "UnityCG.cginc"

			sampler2D _MainTex;
			half4 _MainTex_TexelSize;//单位纹素大小
			float _BlurSize;//采样间隔

			struct v2f {
				float4 pos : SV_POSITION;
				half2 uv[5]: TEXCOORD0;
			};
			//顶点着色-垂直模糊Pass
			v2f vertBlurVertical(appdata_img v) {
				v2f o;
				o.pos = UnityObjectToClipPos(v.vertex);

				half2 uv = v.texcoord;
				//设置垂直方向的采样坐标
				o.uv[0] = uv + float2(0.0, _MainTex_TexelSize.y * 2.0) * _BlurSize;
				o.uv[1] = uv + float2(0.0, _MainTex_TexelSize.y * 1.0) * _BlurSize;
				o.uv[2] = uv;
				o.uv[3] = uv - float2(0.0, _MainTex_TexelSize.y * 1.0) * _BlurSize;
				o.uv[4] = uv - float2(0.0, _MainTex_TexelSize.y * 2.0) * _BlurSize;
				return o;
			}
			//顶点着色-水平模糊Pass
			v2f vertBlurHorizontal(appdata_img v) {
				v2f o;
				o.pos = UnityObjectToClipPos(v.vertex);

				half2 uv = v.texcoord;
				//设置水平方向的采样坐标
				o.uv[0] = uv + float2(_MainTex_TexelSize.x * 2.0, 0.0) * _BlurSize;
				o.uv[1] = uv + float2(_MainTex_TexelSize.x * 1.0, 0.0) * _BlurSize;
				o.uv[2] = uv;
				o.uv[3] = uv - float2(_MainTex_TexelSize.x * 1.0, 0.0) * _BlurSize;
				o.uv[4] = uv - float2(_MainTex_TexelSize.x * 2.0, 0.0) * _BlurSize;

				return o;
			}
			//片元着色
			fixed4 fragBlur(v2f i) : SV_Target {
				//高斯模糊权重
				float weight[5] = { 0.0545,0.2442,0.4026, 0.2442, 0.0545};

				//中心纹理*权重
				fixed3 sum = 0;
				//上下/左右 的2个纹理*权重
				for (int n = 0; n < 5; n++) {
					sum += tex2D(_MainTex, i.uv[n]).rgb * weight[n];
				}
				return fixed4(sum, 1.0);
			}

			ENDCG

			ZTest Always Cull Off ZWrite Off

			Pass {
				NAME "GAUSSIAN_BLUR_VERTICAL"

				CGPROGRAM

				#pragma vertex vertBlurVertical  
				#pragma fragment fragBlur

				ENDCG
			}

			Pass {
				NAME "GAUSSIAN_BLUR_HORIZONTAL"

				CGPROGRAM

				#pragma vertex vertBlurHorizontal  
				#pragma fragment fragBlur

				ENDCG
			}
		}
			FallBack Off
}