矩阵转置的SSE汇编优化艺术以及ARM cortext 汇编优化

平时我们做图像处理或者视频处理, 很多地方会用到矩阵转置: 比如: DCT变换, 图像旋转, 图像滤波, 以及一些数据的内存行和列的交换等, 会大量使用转置这个动作. 然而由于数据量很大,处理速度很慢!如何来提高处理速度呢? 下面看看分析:  HEVC中有个地方是如下这样实现(直接行和列对应的位置交换): Pel tmp; for (k=0;k<blkSize...
阅读(5647) 评论(6)

Intrinsics头文件与SIMD指令集、Visual Studio版本对应表!

Intrinsics头文件与SIMD指令集、Visual Studio版本对应表!   File 描述 VS VisualStudio intrin.h All Architectures 8.0 2005 mmintrin.h MMX intrinsics...
阅读(2559) 评论(2)

程序优化总结--万变不离其宗

程序优化总结--万变不离其宗 空间优化, 时间优化. 目前我们就在PC上,所以主要目标是时间优化. 第一步: 算法结构层面的优化.         搞懂算法,从宏观层面优化结构,能在一个层面做的事情,尽量合并一起做! ...        第二步: C语言层面的优化.         从函数,语言层面优化程序! 1.减少内存访问! 2.合并运算! 3.空间换时间! 4.循环...
阅读(2506) 评论(2)

HEVC中SAO--自适应样点补偿 详细分析解读

HEVC中SAO--自适应样点补偿:   本文分三个部分, 1.Sample Adaptive Offset原理, 2.SAO处理流程分析, 3.SAO意义何在! a)  SAO原理:     SAO是在DB之后进行, 输入是重建帧和原始帧数据, 输出是SAO数据和SAO后的重建帧. 自适应样点补偿是一个自适应选择过程,在去块滤波后进行。 下面是整个HEVC的编码框图, 可以看到SAO是在...
阅读(9975) 评论(11)
    个人资料
    • 访问:414292次
    • 积分:4561
    • 等级:
    • 排名:第7105名
    • 原创:83篇
    • 转载:3篇
    • 译文:1篇
    • 评论:191条
    博客专栏
    最新评论