关于短信内容格式及压缩方法

 

author: scruffybear

release time: 29/08/2007

如有转载,请注明出处,并保持文章的完整性,谢谢!

 七月份做警务通的项目,涉及到对已有的短信内容进行修改的问题,也就是所说的对COS打补丁修改短信内容的问题,联系本项目在这里对G网短信和C网短信的格式和压缩方法进行简单介绍。
1,G网短信的一般格式
   G网短信格式完全遵守《GSM03.40规范》,所以很容易通过现有规范对现有短信进行解析。卡片按照《GSM11.14规范》来组织短信,发送短信的command tag为‘13’,SMS TPDU tag为‘0B/8B’,更详细内容请参见该规范,现用一条具体短信解释格式如下:
   Fetch指令取得短信内容:
   A01200002FSWD02D81030A130082028183850D8077ED4FE153D190014E2D20268B13010008819494881100080812345678123456789000
      Command Details   01/81 03 0A(Command number) 13(command tag) 00(Command Qualifier)    此项是强制的(Mandatory)
      Device identities 02/82 02 81(SIM) 83(Network) 此项是强制的(Mandatory)
      Alpha identifier  05/85 0D 8077ED4FE153D190014E2D2026(短信发送中…) 此项应该是可选的(Optional)
      Address tag   此例中没有,举例:06/86 08FFFFFFFFFFFFFFFF   此项应该是可选的(Optional)
      SMS TPDU tag  0B/8B 13 01000881949488110008081234567812345678(此项内容在GSM03.40规范中解释) 
   SMS TPDU内容由《GSM03.40规范》进行解释,具体可参见该规范9.2节,Service Provided by the SM-TL(The Short Message Transfer Layer),现仅对具体本条短信的TPDU进行解释,内容如上:0B/8B 13 01000881949488110008081234567812345678,此短信为SUBMIT类型:
      TP-MTI(TP-Message-Type-Indicator)等, 01,bit1,bit0最低两位为01,表示短信内容为SMS-SUBMIT (in the direction MS to SC),bit4,bit3为00,表示短信中无TP-VP字段:0 0 TP-VP field not present
      TP-MR(TP-Message-Reference) 00
      TPDA(TP-Destination-Address) 088194948811,TPDA的长度为(len+1)/2+1,在本例中,为(8+1)/2+1=5  
      TP-PID(TP-Protocol-Identifier) 00
      TP-DCS(TP-Data-Coding-Scheme) 08
      TP-VP(TP-Validity-Period) 此短信中无,该项表示短信的有效期。
      TP-UDL+TPUD(TP-User-Data-Length+TP-User-Data) 081234567812345678
      注意:TPUDL长度为实现压缩前的长度。
    以上说明针对具体短信,更多情况请参照相应规范,在此不赘述。          
   
2,G网短信的压缩及汇编实现
   由于补丁中需要对G网短信做压缩,而且不方便调用已有函数,故用汇编实现了G网的短信压缩。
   G网短信压缩格式在TP-DCS中指示,TP-DCS在《GSM03.38》中有说明,一般都采用将7bit编码压缩成8bit编码方式,这种压缩方式也在《GSM03.38》中有详细说明。
   压缩编码方式将8字节的7bit编码压缩成7字节的8bit编码,也就是说160字节长短信可以压缩为140字节的短信,压缩了20字节,具体压缩方法如下: 
   原始的8字节未压缩编码如下:
      - bits number:
        6    5   4   3   2   1   0
        1a 1b 1c 1d 1e 1f 1g
        2a 2b 2c 2d 2e 2f  2g
        3a 3b 3c 3d 3e 3f  3g
        4a 4b 4c 4d  4e 4f 4g
        5a 5b 5c  5d 5e 5f 5g
        6a 6b  6c 6d 6e 6f 6g 
        7a 7b 7c 7d 7e 7f 7g
        8a 8b 8c 8d 8e 8f 8g
  经过压缩后的8bit编码如下:
   
    - eight characters in seven octets:
    - bits number: 
      7   6   5   4   3   2   1   0
     2g 1a 1b 1c 1d 1e 1f 1g
     3f 3g 2a 2b 2c 2d 2e 2f
     4e 4f 4g 3a 3b 3c 3d 3e
     5d 5e 5f 5g 4a 4b 4c 4d
     6c 6d 6e 6f 6g 5a 5b 5c
     7b 7c 7d 7e 7f 7g 6a 6b
     8a 8b 8c 8d 8e 8f 8g 7a
    从以上的压缩方法可以看出,第一个压缩后字节是第一个7bit在最高位加上第二个7bit的最低位,第二个压缩字节是第二个7bit的高六位加上第三个7bit的低两位,依次类推。 第七个压缩后字节(最后一个压缩字节)是第七个7bit的最高位加上整个第八个7bit的七位。这样就实现了将8个字节的7bit编码压缩成7个字节的8bit编码。
    举一个具体的例子,字符串3132333435363738是7bit编码,现压缩成8bit编码。
    3132333435363738转换为bit为00110001(31) 00110010(32) 00110011(33) 00110100(34) 00110101(35) 00110110(36) 00110111(37) 00111000(38),进行转换,过程如下:
    a,转换31,32的最低位到31的最高位,可以看到31不变,第一个压缩后字节为31
    b,转换32,32由于取了最低位,相当于向右移了一位,为00011001,将33的低两位放在右移一位的31高位上,也就为11011001,即D9。
    c,转换33,33由于取了低两位,相当于向右移了两位,为00001100,将34的低三位放在右移两位的33高位上,也就为10001100,即8C。
    d,转换34,34由于取了低三位,相当于向右移了三位,为00000110,将35的低四位放在右移三位的34高位上,也就为01010110,即56。
    e,转换35,35由于取了低四位,相当于向右移了四位,为00000011,将36的低五位放在右移四位的35高位上,也就为10110011,即B3。
    f,转换36,36由于取了低五位,相当于向右移了五位,为00000001,将37的低六位放在右移五位的36高位上,也就为11011101,即DD。
    g,转换37,37由于取了低六位,相当于向右移了六位,为00000000,将整个38的七位放在右移六位的37高位上,也就是1110000,即70。
    到此7位编码的3132333435363738压缩为了7字节的31D98C56B3DD70,也就是说压缩掉了一字节。
    在进行编码实现时,可以将压缩前的短信每8字节为一组进行处理,处理为压缩后的七字节,这样形成外层循环。循环次数为短信长度除以8再向上取整,例如11/8=1, 1+1 = 2,也就是经过两次循环。进行内层循环处理时,需要进行七次循环,循环到n(0<n<8)次时,首先将当前字节右移n-1位,取后一字节的低n位,放在当前字节右移n-1位后的高n位,这样就可以完成对8字节的压缩,进而完成对整个短信的压缩。
    由于涉及到很多相关的前后环境变量的处理,这里仅列出汇编实现的框架(此处为标准51汇编,双DPTR)如下:
 

     ; DPTR和DPTR1都指向短信开始处,R1中存放外层循环变量,内层循环变量为R2,初始值为1,R3中存放需要转换字符的总长度,并已设置好。
     ; 实际上每一次内层循环,都是两字节一处理,这里将两字节分别称为第一字节和第二字节。
     ; 每一次层循环过程是取第二字节的低R2放在第一字节的高R2位上,然后将第二字节右移R2位后作为下一次内层循环的第一字节。
    MOVX  A ,  @DPTR
    MOV   R6
,  A       ; 在进行第一次处理之前预设R6为第一字节内容。
  out_transbegin:     ; 外层循环开始处,循环[len/8](注意是向上取整)次。   
    MOV  R2 ,   # 1       ; 进行外层循环之前,需要将内层循环变更R2设置为1
  transbegin:        ; 内层循环开始处,循环7次。
    MOV  A ,   R6      ; the 2nd number of  last  loop as the first number.
    MOV  R5 ,   A    ; R5  store the 1st number.
    INC  DPTR
    MOVX  A
,   @DPTR
    MOV  R6
,   A    ; R6  store   2rd  number.
    
    MOV  R0
,   A    ; 将第二个字节存放在R0中,以备后用。
    
    MOV  A
,   R2      ; 2*2*...*2(R2个2)-1
    MOV  R7 ,   A     
    LCALL  POWER2   
; POWER2为2的N次方,N从R7传入,POWER2函数实现很简单,这里不列出。
    CLR  C
    SUBB  A
,   #01H      ; 2*2*...*2-1即2的R2次方减一,2exp(R2)-1
    ANL  A ,   R6   ;   2nd number & 111...11, 取后一字节的低R2位,例如第一次循环,取最低位。 2exp(1)-1 = 1, 取最低位,如果为2exp(2)-1=3,取最低两位。
    MOV  R6 ,   A    ; R6 store the anl result  
    
    MOV  A
,   # 8       ; 计算8-R2,取了第二个字节的低R2位后,再左移(8-R2)位,最后与第一个字节进行或操作。
    CLR  C
    SUBB  A
,   R2     ; 8-R2
    MOV  R7 ,   A      ; R7是输入参数,即左移次数。
    MOV  A ,   R6      ; ANL操作的后再左移(8-R2)位,放在第一个字节的高位。
    LCALL  LFRotateN    ; 左位移(8-R2)位,LFRotateN很简单,不列出,结果放在A里。
    
    ORL  A
,   R5    ; 进行或操作,将第二个字节的低R2位放在第一个字节的高R2位上。     
    MOVX  @DPTR1 ,   A         ; 结果存放在DPTR1所指的地方。
    
    MOV  A
,   R2
    MOV  R7
,   A     ; 右移次数。
    MOV  A ,   R0     ; 前面保存的第二字节在R0中,这里右移R2位,作为下一次循环的第一字节。
    LCALL  RTRotateN     ; 右移R2位操作,RTRotateN很简单,不列出,结果放在A里。
    MOV  R6 ,   A     ; R6作为下一次循环的第一字节。    
    
    
    INC DPTR1    
; 写指针DPTR1加1
    INC R2        ; 内层循环变量加1
    
    MOV  A
,   R3    ; R3  is the len
    CLR  C
    SUBB  A
,   # 1
    MOV  R3
,   A     ; R3也就是转换的总长度减一, R3=R3-1
    JZ  transend    ; 如果长度为0,则表示已经处理完所有字节,即出。   
    CJNE  R2 ,   # 8 ,  transbegin    ; 循环范围为1~7
    
    INC  DPTR     
; outer loop proceed,进入下一次外层循环前的准备工作。
    MOVX  A ,   @DPTR
    MOV  R6
,   A     ; 进入下一个8字节处理之前预设第一字节为R6
    
    MOV  A
,   R3    ; R3是短信长度,进入下一次处层循环时,R3长度也要减1,处理的是下一个8字节的头两个字节。
    CLR  C
    SUBB  A
,   # 1
    MOV  R3
,   A
    JZ  transend    
    
    DJNZ  R1
,   out_transbegin    ; loop [len/8] times, 如果R1没减到0,则进入到下层循环。        
                
  transend:   

       以上是7bit编码压缩为8bit编码的算法实现。
      
3 C网短信压缩方法 
    C网短信按照《中国联通800MHz CDMA数字蜂窝移动通信网UTK技术要求》规范进行组织,现简单地解释一条具体短信内容:
      A01200003ASWD038810308130082028183850F806B63572853D19001002E002E002EC81C000002100204080B813193612004F7080B000320000001041017FFE09000          
    这里与G网短信类似,分别为主动式UIM命令标签(13),Alpha标识符(85)(O),设备标识(82),CDMA SMS TPDU(C8)

    C81C000002100204080B813193612004F7080B000320000001041017FFE09000是CDMA SMS TPDU内容,解析如下:
      C81C(tag+len)
      00  (段消息类型:00 SMS point to point)
      00 02 1002   (TAG:teleservice identifier)
      04 08 0B813193612004F7  (Destination Address )
      08 0B 00 03 200000 01 04 1017FFE0  (Bearer Data)
     
     Bearer Data为080B000320000001041017FFE0,进行拆分,
     08 0B(tag+len)
     00 03 200000  (Message Identifier )
     01 04 1017FFE0 (User data )
     首先将0104后内容1017FFE0转换为bit:0001 0000  0001 0111  1111 1111  1110 0000
     前5bit为编码类型,为00010,表示为7bit编码,进行划分即为:00010 0000001 0111111 11111111 00000
    
     以上仅对具体短信进行分析,更多情况请参考《TIA-EIA-637-A》。
     
4, 参考文档:
       1,GSM11.14
       2, GSM03.40
       3, GSM03.38
       4, 中国联通800MHz CDMA数字蜂窝移动通信网UTK技术要求 
       5, TIA-EIA-637-A  

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值