自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (10)
  • 收藏
  • 关注

原创 AMRWB优化

经过1个月时间的优化,AMR-WB解码性能总体提高了近10倍。1. 从ITU官方网站下载代码,在ADS1.2上调试通过。对于测试码流为23.85kbps的向量tst_m8.cod,在ARM926EJS平台上,性能    为105MIPS,156MCPS。2. 根据profile的测试结果,占时间最大的是那些基本算术运算的操作。用ARMv5的内联汇编替换掉以后,性能大概为52MIPS,

2009-11-27 11:40:00 1447 1

转载 AMR中的RO,RW和ZI

要了解RO,RW和ZI需要首先了解以下知识:ARM程序的组成此处所说的“ARM程序”是指在ARM系统中正在执行的程序,而非保存在ROM中的bin映像(image)文件,这一点清注意区别。一个ARM程序包含3部分:RO,RW和ZIRO是程序中的指令和常量RW是程序中的已初始化变量ZI是程序中的未初始化的变量由以上3点说明可以理解为:RO就是readonly,RW就

2009-11-03 12:51:00 1071 1

原创 ARM参数传递规则

1.      r0,r1,r2,r3,在调用函数时,用来存放前4个函数参数和返回值,r4-r11,r14,在调用函数时必须保存这些寄存器到堆栈当中。如果函数的参数多于4个,则多余参数存放在堆栈当中,即sp,sp+4,sp+8,…依次类推。 2.      函数内部通用的入栈出栈代码可以为:STMFD sp!,{r4-r11,lr}// body of ASM code

2009-11-03 12:43:00 7711 5

GPU上矩阵乘法快速实现

GPU上矩阵乘法的设计与实现,对于在cuda上做编程优化的同学有一定的参考价值。

2018-07-14

MTL矩阵模板库

MTL矩阵模板库,可直接在vs2005下面编译并测试。

2014-07-28

图像视频快速非局部去噪算法

图像视频的快速非局部去噪算法的经典文献,作者Mona Mahmoudi and Guillermo Saporo

2013-11-30

快速非局部去噪算法

基于FFT和积分图的快速非局部去噪算法,作者来自浙大

2013-11-30

基于积分图的快速非局部去噪算法

基于积分图的快速非局部去噪算法,作者Venkateswarlu Karnati

2013-11-30

GPU高性能编程CUDA实战代码

GPU高性能编程CUDA实战一书的完全代码下载 《GPU高性能编程CUDA实战》是一本非常好的CUDA入门书,其提供的代码对初学者也非常有用,需要的可以下载看看,源码下载地址

2013-10-06

Bregman算法

Bregman算法的原理,非常详尽的解释

2013-06-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除