Yuv422 to RGB32 查找表+并行计算+MMX+SSE 让你的程序飞起来

   上个星期一直在做Yuv overlay显示问题,程序是写出来了,而且cpu占用率为0,但是有个缺点,不能和MFC的picture控件绑定,我把窗口的picture控件的句柄传给Yuv表面了,拖动会晃动,还且怎是在最上层,郁闷,如果谁知道这个问题的解决办法,欢迎给我留言,呵呵,上周末没办法了,就写Yuv 转RGB的算法吧,一步一步优化,效果还是挺明显的;首先我用浮点运算,晕死,慢于蜗牛,后面我把浮点型该为整型,速度提高了一倍多,然后我用查找表+并行计算;充分利用处理器的特性,速度在提高一倍;然后再将函数改为inline,不要小看这个,速度有所提高哦,接着就是优化算法的语句,减少if else ,因为cpu流水线预判会出错的,用太多的if else的话;另外尽量能用一语句的不要用两个,尤其是赋值,不要小看它,应为200万像素的图片,外面的循环要执行200万次呢,还有就是能用一维数组的不要用2维数组,比如你一个循环能搞定,不要用2个循环;for(int i=0;i<height*width;i++)和for(int i=0;i<height;i++){for (int j=0;j<width;j++)}  这样处理后,程序速度又提高了不少;

 

    最后一步就是将循环的功能采用MMX+SSE实现,程序速度在提高几倍,总的速度提高10多倍不成问题;

 

 

  算法太伟大了。从Yuv422转RGB32中体会了几点:

 

  (1)a=a+1;要写成a++;

   (2)a[i];i++;要写成a[i++];

 (3)内存分配时要尽量化0为整,举例:如用链表实现数组的功能,链表的速度表数组慢100倍,因为它需要不断申请内存;

 (4)注意n/2和n>>1是不样的,只有在正数的时候才等价;在n等于负数时是不等价的,如n=-3;n/2=-1;n>>1=-2;所以在yuv转RGB时要用n>>1代替n/2;

  (5)以为Yuv转RGB是一个非常耗时的工作,所以要想方设法采用以空间换时间的思想,如本文中采用查找表;

 

  (6)并行计算方法,在yuv转RGB时,一次计算2组数据;

 

  (7)最后借助MMX和SSE,在成倍的提高速度,让你的程序飞起来。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值