C# Bitmap图像处理加速

前往我的主页以获得更好的阅读体C# Bitmap图像处理加速 - DearXuan的主页icon-default.png?t=M3C8https://blog.dearxuan.com/2021/11/13/C-Bitmap%E5%9B%BE%E5%83%8F%E5%A4%84%E7%90%86%E5%8A%A0%E9%80%9F/

BitmapData类

BitmapData类专门用于位图处理,与Bitmap的不同点在于,它使用指针直接修改内存,而Bitmap是使用SetPixel()方法间接修改颜色,因此其效率远远超过SetPixel()

传统代码

以灰度处理为例,为了便于演示,此处的灰度算法采用 Gray=(R+G+B) / 3

private void Gray_Tradition()
{
    for(int i = 0; i < bitmap.Width; i++)
    {
        for(int j = 0; j < bitmap.Height; j++)
        {
            Color color = bitmap.GetPixel(i, j);
            int RGB = (color.R + color.G + color.B) / 3;
            bitmap.SetPixel(i, j, Color.FromArgb(255, RGB, RGB, RGB));
        }
    }
}

使用BitmapData的代码

private void Gray_BitmapData()
{
    int width = bitmap.Width, height = bitmap.Height;//图片的宽度和高度
    //在内存中以读写模式锁定Bitmap
    BitmapData bitmapData = bitmap.LockBits(
    new Rectangle(0, 0, width, height),
    ImageLockMode.ReadWrite,
    PixelFormat.Format24bppRgb);
    //图片像素点数组的长度,由于一个像素点占了3个字节,所以要乘上3
    int size = width * height * 3;
    //缓冲区数组
    byte[] srcArray = new byte[size];
    //获取第一个像素的地址
    IntPtr ptr = bitmapData.Scan0;
    //把像素值复制到缓冲区
    Marshal.Copy(ptr, srcArray, 0, size);
    int p;
    for (int i = 0; i < width; i++)
    {
        for (int j = 0; j < height; j++)
        {
            //定位像素点位置
            p = j * width * 3 + i * 3;
            //计算灰度值
            byte color = (byte)((srcArray[p] + srcArray[p + 1] + srcArray[p + 2]) / 3);
            srcArray[p] = srcArray[p + 1] = srcArray[p + 2] = color;
        }
    }
    //从缓冲区复制回BitmapData
    Marshal.Copy(srcArray, 0, ptr, size);
    //从内存中解锁
    bitmap.UnlockBits(bitmapData);
}

效率对比

代码

private void onTest()
{
    double t1, t2;
    Stopwatch watch = new Stopwatch();
    watch.Start();
    Gray_BitmapData();
    watch.Stop();
    t1 = watch.Elapsed.TotalMilliseconds;
    watch.Reset();
    watch.Start();
    Gray_Tradition();
    watch.Stop();
    t2 = watch.Elapsed.TotalMilliseconds;
    MessageBox.Show("BitmapData=" + (long)t1 + "\nTradition=" + (long)t2);
}

图片信息

耗时

可以看到传统方法的耗时是使用BitmapData方法的106倍,需要整整14秒,而BitmapData仅用了0.1秒

GPU加速

使用CUDA生成dll后,可以在GPU上高效处理图像,但是这种方式需要使用dll,而且异常繁琐,因此只适合对效率有极高要求时使用

生成Dll

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <stdio.h>
#include <Windows.h>

__global__ void DoInKernel(byte* o, int num)
{
    int i = blockIdx.x * blockDim.x + threadIdx.x;
    if (i >= num) return;
    byte* ori = o + i * 3;
    ori[0] = ori[1] = ori[2] = (ori[0] + ori[1] + ori[2]) / 3;
}

extern "C" _declspec(dllexport) void Gray(byte * oriArray, int num) {
    int size = num * 3 * sizeof(byte);
    byte* dev_ori;
    //在GPU上分配内存
    cudaMalloc((void**)&dev_ori, size);
    //把数组复制到显存
    cudaMemcpy(dev_ori, oriArray, size, cudaMemcpyHostToDevice);
    //计算
    DoInKernel << <num / 1024 + 1, 1024 >> > (dev_ori, num);
    //从显存复制到内存
    cudaMemcpy(oriArray, dev_ori, size, cudaMemcpyDeviceToHost);
    //释放
    cudaFree(dev_ori);
}

实际上GPU的thread和block数量应该根据实际数组大小来动态调整,但是这里为了演示方便,直接定义1024个线程

调用Dll

[DllImport("CUDA.dll", EntryPoint = "Gray", CallingConvention = CallingConvention.Cdecl)]
public static extern void Gray(IntPtr ori, int num);

此时不需要定义缓冲区数组了,可以直接把数据复制到显存中使用

private void Gray_GPU()
{
    int width = bitmap.Width, height = bitmap.Height;//图片的宽度和高度
    //在内存中以读写模式锁定Bitmap
    BitmapData bitmapData = bitmap.LockBits(
    new Rectangle(0, 0, width, height),
    ImageLockMode.ReadWrite,
    PixelFormat.Format24bppRgb);
    //图片像素点数组的长度,由于一个像素点占了3个字节,所以要乘上3
    int size = width * height * 3;
    //获取第一个像素的地址
    IntPtr ptr = bitmapData.Scan0;
    Gray(ptr, width * height);
    //从内存中解锁
    bitmap.UnlockBits(bitmapData);
    pictureBox1.Refresh();
}

耗时

由于加载dll需要时间,因此第二次执行的耗时才是真正的GPU执行时间 

 仅用了34毫秒

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Dear_Xuan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值