- 博客(2)
- 收藏
- 关注
原创 从一个简单的例子体会ARM环境下的C代码优化
最近花了一些时间致力于ARM下的图像处理代码优化,涉及到不少底层刷新LCD的framebuffer部分。经过一些性能数据测试和代码分析,发现写内存的确是一个瓶颈。因为ARM下面读写内存操作需要按4字节对齐,我所处理的图像数据又都是24bit的,这是典型的不对齐数据。所以刚开始设计的时候,让24位的像素数据本来是一个字节一个字节地刷新的。本能地觉得这样做速度会比较慢,于是记录了一下相关的性能数据,供
2005-12-26 20:33:00 2906 3
原创 初窥WMMX
这段时间对优化比较感兴趣,又看了一些书,谈到优化自然不能少了汇编优化。刚好因为工作的原因,需要编写操纵IINTEL的PXA27X处理器上面的WMMX协处理器的汇编代码,所以又重新拿起ARM的书来看——呵呵,好久都没有看ARM的书了。PXA27X采用的是XSCALE的架构,是ARM系列处理器中比较有代表的一个系列(另外一个代表系列就是TI的OMAP),除了支持标准的ARM指令集之外,还针对多媒体优化
2005-12-16 21:34:00 2622
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人