DSP芯片的定点运算

最新推荐文章于 2022-03-22 15:12:03 发布

Sonictl

最新推荐文章于 2022-03-22 15:12:03 发布

阅读量6.1k

点赞数 3

分类专栏：嵌入式

本文链接：https://blog.csdn.net/sonictl/article/details/9018681

版权

本文排版不恰当，请到新浪爱问下载本文的pdf版，《【豪猪哥】DSP芯片的定点运算1.0》

第3章 DSP芯片的定点运算

3.1 数的定标

在定点DSP芯片中，采用定点数进行数值运算，其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长，一般为16位或24位。显然，字长越长，所能表示的数的范围越大，精度也越高。如无特别说明，本书均以16位字长为例。

DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负，0表示数值为正，1则表示数值为负。其余15位表示数值的大小。因此

二进制数0010000000000011b＝8195

二进制数1111111111111100b＝-4

对DSP芯片而言，参与数值运算的数就是16位的整型数。但在许多情况下，数学运算过程中的数不一定都是整数。那么，DSP芯片是如何处理小数的呢？应该说，DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢？当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。

通过设定小数点在16位数中的不同位置，就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。

从表3.1可以看出，同样一个16位数，若小数点设定的位置不同，它所表示的数也就不同。例如：

16进制数2000H＝8192，用Q0表示

16进制数2000H＝0.25，用Q15表示

但对于DSP芯片来说，处理方法是完全相同的。

从表3.1还可以看出，不同的Q所表示的数不仅范围不同，而且精度也不相同。Q越大，数值范围越小，但精度越高；相反，Q越小，数值范围越大，但精度就越低。例如，Q0的数值范围是-32768到+32767，其精度为1，而Q15的数值范围为-1到0.9999695，精度为 1/32768 = 0.00003051。因此，对定点数而言，数值范围与精度是一对矛盾，一个变量要想能够表示比较大的数值范围，必须以牺牲精度为代价；而想提高精度，则数的表示范围就相应地减小。在实际的定点算法中，为了达到最佳的性能，必须充分考虑到这一点。

浮点数与定点数的转换关系可表示为：

浮点数(x)转换为定点数()： (这里是先乘再int)

定点数()转换为浮点数(x)：（这里是先float再乘）

例如，浮点数 x=0.5，定标 Q＝15，则定点数＝，式中表示下取整。反之，一个用 Q＝15 表示的定点数16384，其浮点数为16384×2^-15

＝16384/32768=0.5。

表3.1 Q表示、S表示及数值范围

Q表示	S表示	十进制数表示范围
Q15	S0.15	-1≤X≤0.9999695
Q14	S1.14	-2≤X≤1.9999390
Q13	S2.13	-4≤X≤3.9998779
Q12	S3.12	-8≤X≤7.9997559
Q11	S4.11	-16≤X≤15.9995117
Q10	S5.10	-32≤X≤31.9990234
Q9	S6.9	-64≤X≤63.9980469
Q8	S7.8	-128≤X≤127.9960938
Q7	S8.7	-256≤X≤255.9921875
Q6	S9.6	-512≤X≤511.9804375
Q5	S10.5	-1024≤X≤1023.96875
Q4	S11.4	-2048≤X≤2047.9375
Q3	S12.3	-4096≤X≤4095.875
Q2	S13.2	-8192≤X≤8191.75
Q1	S14.1	-16384≤X≤16383.5
Q0	S15.0	-32768≤X≤32767

3.2 高级语言：从浮点到定点

在编写DSP模拟算法时，为了方便，一般都是采用高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数，又有浮点数。如例3.1程序中的变量i是整型数，而pi是浮点数，hamwindow则是浮点数组。

例3.1 256点汉明窗计算, C program:

int i;

float pi=3.14159;

float hamwindow[256];

for(i=0;i<256;i++)

hamwindow[i]=0.54-0.46*cos(2.0*pi*i/255);

如果要将上述程序用某种定点DSP芯片来实现，则需将上述程序改写为DSP芯片的汇编语言程序。为了DSP程序调试的方便及模拟定点DSP实现时的算法性能，在编写DSP汇编程序之前一般需将高级语言浮点算法改写为高级语言定点算法。下面讨论基本算术运算的定点实现方法。

3.2.1 加法/减法运算的C语言定点模拟

设浮点加法运算的表达式为：

float x,y,z;

z=x+y;

将浮点加法/减法转化为定点加法/减法时最重要的一点就是必须保证两个操作数的定标值一样。若两者不一样，则在做加法/减法运算前先进行小数点的调整。为保证运算精度，需使Q值小的数调整为与另一个数的Q值一样大。

此外，在做加法/减法运算时，必须注意结果可能会超过16位表示。如果加法/减法的结果超出16位的表示范围，则必须保留32位结果，以保证运算的精度。

1．结果不超过16位表示范围

设x的Q值为Qx，y的Q值为Qy，且Qx>Qy，加法/减法结果z的定标值为Qz，则

z＝x+y Þ

= Þ

所以定点加法可以描述为：

int x,y,z;

long temp; /*临时变量*/

temp＝y<<(Qx－Qy);

// Q大-Q小，Q大的变量分辨率更高，Q小的左移增加其Q

temp＝x＋temp;

z＝(int)(temp>>(Qx－Qz)), 若Qx≥Qz

z＝(int)(temp<<(Qz－Qx)), 若Qx≤Qz

例3.2 定点加法

设x＝0.5，y＝3.1，则浮点运算结果为z＝x+y＝0.5+3.1＝3.6;

Qx＝15，Qy＝13，Qz＝13，则定点加法为：

x＝16384；y＝25395;

temp＝25395<<2＝101580;

temp＝x+temp＝16384+101580＝117964;

z＝(int)(117964L>>2)＝29491;

因为z的Q值为13，所以定点值z＝29491即为浮点值z＝29491/8192＝3.6。

例3.3 定点减法

设x＝3.0，y＝3.1，则浮点运算结果为z＝x-y＝3.0-3.1＝-0.1;

Qx＝13，Qy＝13，Qz＝15，则定点减法为：

x＝24576；y＝25295；

temp＝25395;

temp＝x-temp＝24576-25395＝-819;

因为Qx<Qz，故 z＝(int)(-819<<2)＝-3276。由于z的Q值为15，所以定点值z＝-3276即为浮点值z＝-3276/32768»-0.1。

2．结果超过16位表示范围

设x的Q值为Qx，y的Q值为Qy，且Qx>Qy，加法结果z的定标值为Qz,则定点加法为：

int x，y；

long temp，z；

temp＝y<<(Qx-Qy)；

temp＝x＋temp;

z＝temp>>(Qx-Qz)，若Qx≥Qz

z＝temp<<(Qz-Qx)，若Qx≤Qz

例3.4 结果超过16位的定点加法

设x＝15000，y＝20000，则浮点运算值为z＝x＋y＝35000，显然z>32767，因此, Qx＝1，Qy＝0，Qz＝0，则定点加法为(Assemblypseudo code:)：

x＝30000；y＝20000；

temp＝20000<<1＝40000; //temp32bit

temp＝temp + x＝40000+30000＝70000;

z＝70000L>>1＝35000;

当Q值为0时，定点值就简单视为变量本身，即就是浮点值（见表3.1）。因为z的Q值为0，所以定点值z=35000就是浮点值，这里z是一个长整型数。

当加法或加法的结果超过16位表示范围时，如果程序员事先能够了解到这种情况，并且需要保证运算精度时，则必须保持32位结果。如果程序中是按照16位数进行运算的，则超过16位实际上就是出现了溢出。如果不采取适当的措施，则数据溢出会导致运算精度的严重恶化。一般的定点DSP芯片都设有溢出保护功能，当溢出保护功能有效时，一旦出现溢出，则累加器ACC的结果为最大的饱和值(上溢为7FFFH，下溢为8001H)，从而达到防止溢出引起精度严重恶化的目的。

3.2.2 乘法运算的C语言定点模拟

设浮点乘法运算的表达式为：

float x,y,z;

z = xy;

假设经过统计后x, y, z的定标值为Qx, Qy, Qz，则数学原理:

z = xy Þ

= Þ

所以定点表示的乘法为(Assembly pseudo code)：

int x,y,z;

long temp;

temp = (long)x;

z = (temp×y) >>(Qx+Qy-Qz);

例3.5 定点乘法

设x = 18.4，y = 36.8，则浮点运算值为z =18.4×36.8 = 677.12;

根据上节，得Qx = 10，Qy = 9，Qz = 5，所以

x = 18841；y = 18841；

temp = 18841L;

z = (18841L*18841)>>(10+9-5) = 354983281L>>14 = 21666;

因为z的定标值为5，故定点 z = 21666即为浮点的 z = 21666/32 = 677.08。

Here is the C code for the above pseudo code for fixed pointmultiplication:

#include "stdafx.h" // Thisis for visual studio C++

#include "stdio.h"

// Qx = 10, Qy = 9, Qz = 5

// x_f = 18.4, y_f = 36.8, x_int = 18841, y_int = 18841

最低0.47元/天解锁文章

Sonictl

关注

3
点赞
踩
26

收藏

觉得还不错? 一键收藏
2
评论
DSP芯片的定点运算

本文排版不恰当，请到新浪爱问下载本文的pdf版，《【豪猪哥】DSP芯片的定点运算1.0》第3章 DSP芯片的定点运算3.1 数的定标在定点DSP芯片中，采用定点数进行数值运算，其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长，一般为16位或24位。显然，字长越长，所能表示的数的范围越大，精度也越高。如无特别说明，本书均以16位字长为例。DSP
复制链接

扫一扫