深度学习计算框架综述(十三)HVX 计算优化实践—HVX汇编技巧与经验

以下技巧与经验是我们在编写HVX汇编代码时总结出来的,其实对于ARM/Intel 汇编也是通用的。

  • 寄存器声明
  • 结构体传参
  • 寄存器复用
  • 反汇编
  • 寄存器值打印

寄存器声明

如下所示,通过对寄存器命名,可以大大提高代码的可读性,便于维护。

// conv1x1s1d32_v66_asm.S

#define     vtcm_input          r0
#define     suma                r1
#define     weight_data         r2
#define     output_data         r3
#define     callback_data       r5     // conv_callback_t defined in conv_opt.h
#define     l2fetch_weight_para r23:22
 
#define     quant_mul           v0
#define     fixed_0_5           v1
#define     output_zeropoint    v2
#define     bias_val            v3

结构体传参

当函数传参过多时,可以考虑将变量封装在一个结构体中,这样可以有效减少传参个数,同时也能够节约栈空间,如下所示,Hexagon NN的conv函数传参数量为17,而VCAP Hexagon只有7个:

(*conv)(input + info->in_depth*LPAD, //adjust for left integral pad
        work->weigh
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值