[原创]10^9进制高精度大整数减法(MMX版本)

原创 2004年07月13日 12:18:00

// 本代码使用在分治法的时候,不必考虑数据对齐的问题(如果考虑就复杂了),len也是偶数,所以后面的len为奇数的检查部分是没有必要的,跟一般的方法快不了多少,微乎其微,在此仅提供另外一种思路,本人原创的,如果你有更好的方法请告知

// 实现 dest = a - b ,dest, a, b都是高位在前,低位在后,即dest[0]表示数的最高位,a,b也类似

const unsigned int Base = 1000000000;    // 10^9

const unsigned __int64 Sign64      = 0x0000000000000000;
const unsigned __int64 BorrowFirst = 0x0000000100000000;
const unsigned __int64 BorrowNext  = 0x0000000000000001;

/* sub_mmx() mmx指令版本 */
__declspec(naked)
long sub_mmx(unsigned long *dest, unsigned long *a, unsigned long *b, size_t len)
{
    __asm
    {
        mov ecx, dword ptr [esp+0x10]   // len
        xor eax, eax
        test ecx, ecx
        jz sub_exit

        push ebp
        mov ebp, ecx

        push ebx
        mov ebx, dword ptr [esp+0x14]   // ebx = b
        push esi
        mov esi, dword ptr [esp+0x14]   // esi = a
        push edi
        mov edi, dword ptr [esp+0x14]   // edi = dest
        sub esi, ebx                    // esi = a - b
        lea edx, dword ptr [ebx+4*ecx-8]    // &b[i]
        sub edi, ebx                    // edi = dest - b

        shr ecx, 1                      // len = len / 2

        movq mm7, Base64                // 0x3B9ACA003B9ACA00
        movq mm5, BorrowFirst           // 0x0000000100000000
        movq mm6, BorrowNext            // 0x0000000000000001
       
        pxor mm2, mm2                   // borrow 清零

sub_loop:
        movq mm0, dword ptr [esi+edx]   // a[i]
        movq mm1, dword ptr [edx]       // b[i]

        psubd mm0, mm2                  // dif = a[i]-borrow
        pxor mm3, mm3                   // mm3 = Sign64 (0x0000000000000000)
        psubd mm0, mm1                  // dif -= b[i]

        pcmpgtd mm3, mm0                // dif < 0 ? 这里比较复杂,有讲究,必须比较2次
        pand mm3, mm5                   // mm5 = BorrowFirst
        psrlq mm3, 32                   // 获得进位 BorrowFirst, mm3 >> 32
       
        pxor mm4, mm4                   // mm4 = Sign64 (0x0000000000000000)
        psubd mm0, mm3                  // 累减进位

        pcmpgtd mm4, mm0                // dif < 0 ? 进位以后,第二次比较

        movq mm2, mm4                   // 备份比较结果
        pand mm4, mm7                   // 获得进位加法变量, 用于dif += Base
        pand mm2, mm6                   // 获得下一次的进位, BorrowNext

        paddd mm0, mm4                  // 相当于 dif += Base
        psllq mm2, 32                   // borrow = BorrowNext << 32

        movq dword ptr [edi+edx], mm0   // dest[i] = dif
        sub edx, 8                      // edx = &b[i] - 8, 相当于i-=2
        dec ecx                         // len--
        jne sub_loop
///*
        test ebp, 1                     // 如果len是奇数,则累减最后一个数
        jz sub_fast_ret

        mov ecx, dword ptr [esi+edx]    // esi = a[i]
        mov ebx, dword ptr [edx]        // edx = b[i]
        sub ecx, ebx                    // dif = a[i] - b[i]
        mov ebx, Base                   // esi = Base
        add ecx, eax                    // dif -= borrow
        xor eax, eax                    // borrow = 0
        cmp ecx, ebx                    // dif < 0 ?
        jb  sub_dif                     // <
        mov eax, 1                      // borrow = 1
        add ecx, ebx                    // dif += Base

sub_dif:
        mov dword ptr [edi+edx], ecx    // dest[i] = dif

        pop edi
        pop esi
        pop ebx
        pop ebp

        emms
sub_exit:
        ret

sub_fast_ret:
//*/

        psrlq mm2, 32                   // borrow >> 32
        movd eax, mm2                   // 返回borrow

        pop edi
        pop esi
        pop ebx
        pop ebp

        emms
//sub_exit:
        ret
    }
}

版权声明:本文为博主原创文章,未经博主允许不得转载。

高精度计算-大整数加减法

问题描述求两个不超过 200 位的非负整数的和。 输入数据 有两行,每行是一个不超过 200 位的非负整数,没有多余的前导 0。 输出要求 一行,即相加后的结果。结果里不能有多余的前导 0,即...
  • zwhlxl
  • zwhlxl
  • 2015年05月04日 10:22
  • 2267

[原创]10^9进制高精度大整数加法(MMX版本)

// 本代码使用在分治法的时候,不必考虑数据对齐的问题(如果考虑就复杂了),len也是偶数,所以后面的len为奇数的检查部分是没有必要的,跟一般的方法快不了多少,微乎其微,在此仅提供另外一种思路,本人...
  • shines
  • shines
  • 2004年07月13日 12:17
  • 2340

高精度计算-大整数除法

问题描述求两个大的正整数相除的商 输入数据 第 1 行是测试数据的组数 n,每组测试数据占 2 行,第 1 行是被除数,第 2 行是除数。 每组测试数据之间有一个空行,每行数据不超过 100 个...
  • zwhlxl
  • zwhlxl
  • 2015年05月05日 10:41
  • 1924

大整数-减法

问题描述 本文主要给出大数减法的一般思路。关于大数的一般性阐述可以参看大整数-加法-demo这篇博客。 思路基本来说,还是大整数的那套思路。 要进行处理的数字,超过了计算机语言所能提供类型的最大...
  • Kang_TJU
  • Kang_TJU
  • 2016年08月16日 20:12
  • 1242

高精度(大整数减法)

#include #include using namespace std; #define M 250 int a[M]; int b[M]; char a1...
  • JESSE_MC
  • JESSE_MC
  • 2010年07月15日 16:02
  • 253

高精度减法——一步一步算法篇

高精度减法利用竖式计算的方式,注意借位和错位,还有前导0。#include #include #include #include #include using namespace std; int m...
  • zhhe0101
  • zhhe0101
  • 2016年05月15日 19:20
  • 1727

大整数加减法(C++实现)

头文件:LargeInteger.h #ifndef LARGEINTEGER_H_INCLUDED #define LARGEINTEGER_H_INCLUDED #include using...
  • TQH_Candy
  • TQH_Candy
  • 2016年08月16日 09:10
  • 2655

十进制转换2-9进制转换

#include void to_base_n(int x, int base); int main(void) { int number; int b; int count...
  • MACHINE_128
  • MACHINE_128
  • 2017年12月11日 10:33
  • 71

高精度减法pascal程序

const  max=1000; var a,b:array[0..max]of longint; procedure init; var s1,s2,s:string; l1,l2,i...
  • SSLGZ_yyc
  • SSLGZ_yyc
  • 2017年01月13日 21:55
  • 504

C语言 高精度减法

#include #include int main() { char m[555],n[555]; int i,len_m,len_n; i...
  • u014571355
  • u014571355
  • 2014年05月02日 14:41
  • 2830
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:[原创]10^9进制高精度大整数减法(MMX版本)
举报原因:
原因补充:

(最多只允许输入30个字)