采用5x5高斯滤波,使灰度位图更加平滑,并且优化运算效率,
目前,2560x960像素的一幅灰度位图,在1.4毫秒内完成计算。
MyDetectFilterG5 PROC
mov qword ptr [rsp + 08h], rbx ; backupReg
mov qword ptr [rsp + 10h], rsi ; backupReg
mov qword ptr [rsp + 18h], rdi ; backupReg
mov rbx, qword ptr [rsp + 28h] ; currPixel
mov rsi, qword ptr [rsp + 30h] ; lineCache
mov rdi, qword ptr [rsp + 38h] ; destPixel
mov qword ptr [rsp + 20h], r12 ; backupReg
mov qword ptr [rsp + 28h], r13 ; backupReg
vinserti128 ymm8, ymm8, xmm6, 01h ; backupReg
vinserti128 ymm9, ymm9, xmm7, 01h ; backupReg
movzx rax, byte ptr [r9 + 00h] ; factor_00
vmovq xmm0, rax ; factor_00
vpbroadcastw ymm3, xmm0 ; factor_00
movzx rax, byte ptr [r9 + 01h]