CSAPP题目 3.59

最新推荐文章于 2024-04-28 18:32:28 发布

althumi

最新推荐文章于 2024-04-28 18:32:28 发布

阅读量556

点赞数 4

分类专栏： CSAPP学习记录文章标签：算法 linux c语言汇编计算机基础

本文链接：https://blog.csdn.net/althumi/article/details/126082891

版权

CSAPP学习记录专栏收录该内容

1 篇文章 0 订阅

订阅专栏

题目描述：
下面的代码计算两个 $64$ 位有符号值 $x$ 和 $y$ 的 $128$ 位乘积，并将结果储存在内存中：

typedef __int128 int128_t;

void store_prod(int128_t *dest, int64_t x, int64_t y) {
	*dest = x * (int128_t) y;
}

$GCC$ 编译器产出了下面的汇编代码来实现计算：

store_prod:
	movq	%rdx, %rax
	cqto
	movq	%rsi, %rcs
	sarq 	$63, %rcx
	imulq	%rax, %rcx
	imulq	%rsi, %rdx
	addq	%rdx, %rcx
	mulq	%rsi
	addq	%rcx, %rdx
	movq	%rax, (%rdi)
	movq	%rdx, 8(%rdi)

为了满足在 $64$ 位机器上实现128位运算所需的多精度计算，这段代码用了三个乘法。描述用来计算乘积的算法，对汇编代码加注释，说明它是如何实现你的算法的。提示：在参数 $x$ 和参数 $y$ 拓展 $128$ 位时，他们可以重写为 $2^{64}\times x_h + x_l$ 和 $2^{64} \times y_h+y_l$ 这里 $x_h,x_l,y_h,y_l$ 都是 $64$ 位值。请解释这段代码是如何用 $x_h,x_l,y_h,y_l$ 来计算 $p_h$ 和 $p_l$ 的。

分析：
说实话第一次接触 $C$ 语言底层的汇编逻辑挺不适应的，这些寄存器跑到在这儿有哪儿真的很麻烦。不过最终发现其实我对拓展运算的不熟悉导致的。

因为 $64$ 位机器，所以一个寄存器最大也就 $64$ 位，这导致如果要拓展到 $128$ 位的运算，得借助两个寄存器。最初我十分不解 sarq $63,%rcx 的作用是什么，真的脑袋完全无法想到。前面书本中介绍的拓展就是只有 $c pt o$ （ $8$ 字节拓展到 $16$ 字节）,以及 $c ltq$ 这两种符号拓展。

既然是符号拓展，注意到这右移运算也是算术右移，好了，真相大白，在这之前还有一句 movq %rsi, %rcx 即此时 $\%rcx$ 执行了算术右移后相当于是对 $x$ 进行了符号拓展，而 $\%rcx$ 存的就是 $x_h$ 。

好了，理解了这个右移后，就知道在执行 imulq %rax,%rcx ，前每个寄存器存的数据的实际意义了，如下表所示：

%rdx	%rax	%rcx	%rsi
$y_h$	$y_l$	$x_h$	$x_l$

此时现理解数学上的 $128$ 位乘法，定义 $×128t \times_{128}^{t}$ 运算符为 $128$ 为的补码乘法运算。根据第二章可知 $\times_{128}^t y=x\times y \pmod{2^{128}}$ 。所以
$\times_{128}^t y=x\times y \pmod{2^{128}} = (x_h\times 2^{64}+x_l)(y_h\times 2^{64}+y_l)\pmod{2^{128}}$

展开可得
$\times_{128}^t y = (x_h \times y_l + x_l \times y_h + \lfloor\frac{x_l\times y_l}{2^{64}}\rfloor \pmod{2^{64}}) \times 2^{64} + (x_l\times y_l\pmod{2^{64}})$

所以乘积结果 $p_h\times2^{64}+p_l$ 的 $p_h = x_h \times y_l + x_l \times y_h + \lfloor\frac{x_l\times y_l}{2^{64}}\rfloor \pmod{2^{64}}$ ，而 $p_l = x_l\times y_l\pmod{2^{64}}$ 。

这时再来看下面的乘法逻辑，我们也使用表来看看

	%rdx	%rax	%rcx	%rsi
	$y_h$	$y_l$	$x_h$	$x_l$
imulq %rax, %rcx	$y_h$	$y_l$	$x_h\times_{64}^ty_l$	$x_l$
imulq %rsi, %rdx	$x_l\times_{64}^ty_h$	$y_l$	$x_h\times_{64}^ty_l$	$x_l$
addq %rdx, %rcx	$x_l\times_{64}^ty_h$	$y_l$	( $x_h\times_{64}^ty_l) +_{64}^t (x_l\times_{64}^ty_h)$	$x_l$
mulq %rsi	$\lfloor\frac{x_l\times y_l}{2^{64}}\rfloor$	$y_l\times_{64}^t x_l$	( $x_h\times_{64}^ty_l) +_{64}^t (x_l\times_{64}^ty_h)$	$x_l$
addq %rcx, %rdx	$(x_h\times_{64}^ty_l) +_{64}^t (x_l\times_{64}^ty_h) +_{64}^t \lfloor\frac{x_l\times y_l}{2^{64}}\rfloor$	$y_l\times_{64}^t x_l$	$(x_h\times_{64}^ty_l) +_{64}^t (x_l\times_{64}^ty_h)$	$x_l$

这里比较反常的就是 mulq %rsi ，之前我一直没注意到 $m u lq$ 无符号拓展就导致原本的 $\%rdx$ 寄存器里的数据就只剩下 $\lfloor\frac{x_l\times y_l}{2^{64}}\rfloor$ 。所以一直不理解后面还要执行 addq %rcx, %rdx 。