DSP芯片的定点运算

本文排版不恰当,请到新浪爱问下载本文的pdf版《【豪猪哥】DSP芯片的定点运算1.0》

第3章  DSP芯片的定点运算

3.1 数 的定 标

在定点DSP芯片中,采用定点数进行数值运算,其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长,一般为16位或24位。显然,字长越长,所能表示的数的范围越大,精度也越高。如无特别说明,本书均以16位字长为例。

DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负,0表示数值为正,1则表示数值为负。其余15位表示数值的大小。因此

二进制数0010000000000011b=8195

二进制数1111111111111100b=-4

对DSP芯片而言,参与数值运算的数就是16位的整型数。但在许多情况下,数学运算过程中的数不一定都是整数。那么,DSP芯片是如何处理小数的呢?应该说,DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢?当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。

通过设定小数点在16位数中的不同位置,就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。

从表3.1可以看出,同样一个16位数,若小数点设定的位置不同,它所表示的数也就不同。例如:

16进制数2000H=8192,用Q0表示

16进制数2000H=0.25,用Q15表示

但对于DSP芯片来说,处理方法是完全相同的。

从表3.1还可以看出,不同的Q所表示的数不仅范围不同,而且精度也不相同。Q越大,数值范围越小,但精度越高;相反,Q越小,数值范围越大,但精度就越低。例如,Q0的数值范围是-32768到+32767,其精度为1,而Q15的数值范围为-1到0.9999695,精度为 1/32768 = 0.00003051。因此,对定点数而言,数值范围与精度是一对矛盾,一个变量要想能够表示比较大的数值范围,必须以牺牲精度为代价;而想提高精度,则数的表示范围就相应地减小。在实际的定点算法中,为了达到最佳的性能,必须充分考虑到这一点。

浮点数与定点数的转换关系可表示为:

浮点数(x)转换为定点数():  (这里是先乘再int)

定点数()转换为浮点数(x):  (这里是先float再乘)

例如,浮点数 x=0.5,定标 Q=15,则定点数=,式中表示下取整。反之,一个用 Q=15 表示的定点数16384,其浮点数为16384×2-15

=16384/32768=0.5。

表3.1 Q表示、S表示及数值范围

Q表示

S表示

十进制数表示范围

Q15

S0.15

-1≤X≤0.9999695

Q14

S1.14

-2≤X≤1.9999390

Q13

S2.13

-4≤X≤3.9998779

Q12

S3.12

-8≤X≤7.9997559

Q11

S4.11

-16≤X≤15.9995117

Q10

S5.10

-32≤X≤31.9990234

Q9

S6.9

-64≤X≤63.9980469

Q8

S7.8

-128≤X≤127.9960938

Q7

S8.7

-256≤X≤255.9921875

Q6

S9.6

-512≤X≤511.9804375

Q5

S10.5

-1024≤X≤1023.96875

Q4

S11.4

-2048≤X≤2047.9375

Q3

S12.3

-4096≤X≤4095.875

Q2

S13.2

-8192≤X≤8191.75

Q1

S14.1

-16384≤X≤16383.5

Q0

S15.0

-32768≤X≤32767

 

3.2  高级语言:从浮点到定点

在编写DSP模拟算法时,为了方便,一般都是采用高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数,又有浮点数。如例3.1程序中的变量i是整型数,而pi是浮点数,hamwindow则是浮点数组。

例3.1  256点汉明窗计算, C program:

int   i;

float pi=3.14159;

float hamwindow[256];

for(i=0;i<256;i++)

hamwindow[i]=0.54-0.46*cos(2.0*pi*i/255);

如果要将上述程序用某种定点DSP芯片来实现,则需将上述程序改写为DSP芯片的汇编语言程序。为了DSP程序调试的方便及模拟定点DSP实现时的算法性能,在编写DSP汇编程序之前一般需将高级语言浮点算法改写为高级语言定点算法。下面讨论基本算术运算的定点实现方法。

3.2.1 加法/减法运算的C语言定点模拟

 

设浮点加法运算的表达式为:

float x,y,z;

z=x+y;

将浮点加法/减法转化为定点加法/减法时最重要的一点就是必须保证两个操作数的定标值一样。若两者不一样,则在做加法/减法运算前先进行小数点的调整。为保证运算精度,需使Q值小的数调整为与另一个数的Q值一样大。

此外,在做加法/减法运算时,必须注意结果可能会超过16位表示。如果加法/减法的结果超出16位的表示范围,则必须保留32位结果,以保证运算的精度。

 

1.结果不超过16位表示范围

设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法/减法结果z的定标值为Qz,则

z=x+y   Þ

=     

=  Þ

所以定点加法可以描述为:

int x,y,z;

long temp;    /*临时变量*/

temp=y<<(Qx-Qy); 

// Q大-Q小,Q大的变量分辨率更高,Q小的左移增加其Q

temp=x+temp;

z=(int)(temp>>(Qx-Qz)), 若Qx≥Qz

z=(int)(temp<<(Qz-Qx)), 若Qx≤Qz

 

例3.2  定点加法

设x=0.5,y=3.1,则浮点运算结果为z=x+y=0.5+3.1=3.6;

Qx=15,Qy=13,Qz=13,则定点加法为:

x=16384;y=25395;

temp=25395<<2=101580;

temp=x+temp=16384+101580=117964;

z=(int)(117964L>>2)=29491;

因为z的Q值为13,所以定点值z=29491即为浮点值z=29491/8192=3.6。

 

例3.3  定点减法

设x=3.0,y=3.1,则浮点运算结果为z=x-y=3.0-3.1=-0.1;

Qx=13,Qy=13,Qz=15,则定点减法为:

x=24576;y=25295;

temp=25395;

temp=x-temp=24576-25395=-819;

 

因为Qx<Qz,故 z=(int)(-819<<2)=-3276。由于z的Q值为15,所以定点值z=-3276即为浮点值z=-3276/32768»-0.1。

 

2.结果超过16位表示范围

设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法结果z的定标值为Qz,则定点加法为:

int x,y;

long temp,z;

temp=y<<(Qx-Qy);

temp=x+temp;

z=temp>>(Qx-Qz),若Qx≥Qz

z=temp<<(Qz-Qx),若Qx≤Qz

 

例3.4  结果超过16位的定点加法

设x=15000,y=20000,则浮点运算值为z=x+y=35000,显然z>32767,因此, Qx=1,Qy=0,Qz=0,则定点加法为(Assemblypseudo code:):

x=30000;y=20000;

temp=20000<<1=40000;    //temp32bit

temp=temp + x=40000+30000=70000;

z=70000L>>1=35000;

 

当Q值为0时,定点值就简单视为变量本身,即就是浮点值(见表3.1)。因为z的Q值为0,所以定点值z=35000就是浮点值,这里z是一个长整型数。

当加法或加法的结果超过16位表示范围时,如果程序员事先能够了解到这种情况,并且需要保证运算精度时,则必须保持32位结果。如果程序中是按照16位数进行运算的,则超过16位实际上就是出现了溢出。如果不采取适当的措施,则数据溢出会导致运算精度的严重恶化。一般的定点DSP芯片都设有溢出保护功能,当溢出保护功能有效时,一旦出现溢出,则累加器ACC的结果为最大的饱和值(上溢为7FFFH,下溢为8001H),从而达到防止溢出引起精度严重恶化的目的。

 

3.2.2  乘法运算的C语言定点模拟

设浮点乘法运算的表达式为:

float x,y,z;

z = xy;

 

假设经过统计后x, y, z的定标值为Qx, Qy, Qz,则数学原理:

z = xy Þ

= Þ

 =

所以定点表示的乘法为(Assembly pseudo code):

int x,y,z;

long temp;

temp = (long)x;

z = (temp×y) >>(Qx+Qy-Qz);

例3.5  定点乘法

x = 18.4,y = 36.8,则浮点运算值为z  =18.4×36.8 = 677.12;

根据上节,得Qx = 10,Qy = 9,Qz = 5,所以

x = 18841;y = 18841;

temp = 18841L;

z = (18841L*18841)>>(10+9-5) = 354983281L>>14 = 21666;

因为z的定标值为5,故定点 z = 21666即为浮点的 z = 21666/32 = 677.08。

Here is the C code for the above pseudo code for fixed pointmultiplication:

#include "stdafx.h"  // Thisis for visual studio C++

#include "stdio.h"

// Qx = 10, Qy = 9, Qz = 5

// x_f = 18.4, y_f = 36.8, x_int = 18841, y_int = 18841

  • 3
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值