nasm 用xmm寄存器做矩阵相加溢出了如何处理?

一 假设相加的两个数大于255,8bit存储不下。

比如200 + 200。

二 先scale到16bit存储,然后再相加即可

汇编代码:

global Add
global AddSafe
Add:
	movdqa xmm0, [rdi]
	movdqa xmm1, [rsi]
	paddb  xmm0, xmm1
	movdqu [rdx], xmm0
AddSafe:
	movdqa xmm0, [rdi];//装载到128位寄存器
	vpmovzxbw ymm0, xmm0;//扩展到16bit一个单元
	movdqa xmm1, [rsi]
	vpmovzxbw ymm1, xmm1;//同上
	vpaddw ymm1, ymm1, ymm0;// 按word 相加
	vmovdqa [rdx], ymm1;//存储出去

三 c语言代码

#include <stdio.h>
#include <string.h>
extern void Add(unsigned char *a, unsigned char *b, unsigned char *c);
extern void AddSafe(unsigned char *a, unsigned char *b, unsigned char *c);
int main()
{
    unsigned char a[16], b[16], c[32];
    memset(a, 200, 16);
    memset(b, 200, 16); 
    memset(c, 0x0, 32);
    AddSafe(a, b, c);//存储需要256位
    for (int i = 0; i < 32; i++)
	    printf("%d ", c[i]);
    return 0;
}

四 运行输出

test# ./addTest 

144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 144 1 #   

1是进位的,1 * 255 + 144

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值