ARMv4体系结构能有效的load-store 8位 16位 32 位数据, 但是大多数ARM数据处理都是32位的 , 所以局部变量尽可能的使用32位变量 以减少数据的扩展带来的时间损耗, 除非特殊的数据溢出处理