BER编码
一.基本规则
BER(BasicEncoding Rules)是ASN.1中最早定义的编码规则,其他编码规则是在BER的基础上添加新的规则构成。
1.BER传输语法的格式一直是TLV三元组<Type,Length, Value>.
T是Tag,L是整个类型的长度,V是类型的Value,它还可以是TLV或TLV组合
2.BER传输语法是基于八位组大端编码的,高八位在左。
3.Tag是一个或若干个八位组
(1).UniversalTag类型(值是0-30):
第七、六位指明Tag的类型,UniversalTag类型用00表示;第五位指明该类型以primitive方式编码还是constructed方式编码。
Tagvalue值是基本类型的Tag的值,例如INTEGER的Tag值是2,SEQUENCE型类Tag值是16:
ASN.1中定义的UNIVERSAL类Tag
-
Tag
类型
0
BER保留
1
BOOLEAN
2
INTEGER
3
BIT STRING
4
OCTET STRING
5
NULL
6
OBJECT IDENTIFIER
7
ObjectDescripion
8
EXTERNAL,INSTANCE OF
9
REAL
10
ENUMERATED
11
EMBEDDED PDV
12
UFT8String
13
RELATIVE-OID
14
保留
15
保留
16
SEQUENCE,SEQUENCE OF
17
SET,SET OF
18
NumericString
19
PrintableString
20
TeletexString,T61String
21
VideotexString
22
IA5String
23
UTCTime
24
GeneralizedTime
25
GraphicString
26
VisibleString,ISO646String
27
GeneralString
28
UniversalString
29
CHARACTER STRING
30
BMPString
31
保留
(2).当Tag大于30时,多个八位组中编码,第一个八位组后五位全部为1,其余的八位组最高位为1表示后续还有,为0表示Tag结束。
第一个八位组高二位的取值:00表示Universal,01表示APPLICATION类型,10表示context-specific,11表示PRIVATE类型
2.BER编码中Length表示Value部分所占八位组的个数,有两大类:定长方式(DefiniteForm)和不定长方式(IndefiniteForm)
(1).定长方式
定长方式中,按长度是否超过一个八位,又分为短、长两种形式:
短:类型长度大于等于0个八位,小于等于127
长:类型长度大于等于127个八位,小于等于256^126-1
第一个八位组的低七位指明整个L所占用的八位组个数,后续八位组表示V的长度
(2).不定长方式
Length所在八位组固定编码为0x80,但在Value编码结束后以两个0x00结尾。这种方式使得可以在编码没有完全结束的情况下,可以先发送部分消息给对方。
二.各类型的编码
以UNIVERSALTag和短型Value为例,讨论各种类型的BER编码,重点关注Value部分。
1.BOOLEAN
只能以primitive方式编码,FALSE的编码为(n10表示10进制):
TRUE的编码(任何不是全0都可以)为:
或者:
2.NULL
只能以primitive方式编码,且只有一个值:
3.INTEGER
只能以primitive方式编码。
(1).对于正数,如果最高比特位为0则直接编码;如果为1,则在最高比特位之前增加一个全0的八位组。
最高位为0:
最高位为1:
(2).对于负数,先取绝对值,再取反,最后加1。
4.ENUMERATED
按照整数值的规则编码。
5.REAL
(1).0:
(2).正无穷大:
(3).负无穷大:
(4).基于10进制且以10为底的指数方法:
NR有三个可选值:
NR1:在V中底6位用000001表示,表示不带小数和指数的简单10进制整数。
例如4902,#4902,##4902,+4902等,#表示空格,每个字符占一个8位组。
NR2:在V中底6位用000010表示,表示还小数点的10进制数
例如4902.00,#4902.0,1.0
NR3:在V中底6位用000011表示,在NR2的基础上扩展,用字符‘E’代表以10为底的指数
例如+0.56.0E2,0.2E-3
实数的表示方法在ISO6093标准文档中做了详细定义。
(5).基于2进制的编码方式
这种方式比较奇怪,先放一边
6.BIT STRING
可以primitive方式编码或者constructed方式编码。
(1).Primitive方式:
例如'1011011101011'B的编码
V中第一个八位取值0-7,表示在这个V后面补的0的个数
如果BITSTRING的值为空,则编码时,长度为1,补充的八位组为全0。
(2).constructed方式
'1011011101011'B的编码
L的最高位是1,说明是不定长方式编码,V中嵌套两个TLV,以Primitive方式表示这个值的高八位和低八位,最后以两个全为0的八位结尾
7.OCTET STRING
与BITSTRING类似,但是不需要增加表征补充位个数的八位组。
8.OBJECT IDENTIFIER
只能以primitive方式编码。编码时,第一个八位组采用公式:first_arc* 40+second_arc。如果一个数大于127,就采用多个8位表示,最高位用1表示后续还有octet,用0表示后续没有。
例:对{isomember-body f(250) type-org(1) ft(16) asn1-book(9)}的编码为
注意对250的编码方式,1×128+122。
9.RELATIVE-OID
与OBJECTIDENTIFIER类似,但是不需要对注册树前两段进行特殊处理。
10.字符串和日期
和OCTETSTRING编码类似,只是Tag不同。
11.SEQUENCE只能用constructed形式。
对每个成员均以TLV方式编码,且顺序要与定义的一致。
v SEQUENCE { age INTEGER, single BOOLEAN } ::={age 24, single TRUE }的编码为:
注意BOOLEAN类型,非0表示真。
忽略扩展符'...',对扩展的内容则按顺序编码。
12.SET
与SEQUENCE类似,但是成员顺序有发送者决定。
13.SEQUENCEOF
SEQUENCEOf的Tag与SEQUENCE相同,编码规则也相同。
14.SETOF
与SEQUENCEOf类似。
15.CHOICE
严格说CHOICE类型在编码中并不存在,只是在描述中体现一种关系。编码时,是按照具体被选择的成员编码规则编码的。
例如amousCHOICE { name VisibleString, nobody NULL } ::= name:"Perec"
的编码为:
Tag为26,上选定成员的类型的tag。
如果CHOICE类型显式(EXPLICIT)指定了Tag,那么该Tag应当以constructed方式编码。
忽略扩展符'...',对扩展的内容则按顺序编码。
16.Tag对编码的影响
(1).如果Tag是隐式的,或者在模块定义中声明了IMPLICITTAGS或者AUTOMATICTAGS,则只有关键字IMPLICIT左侧的Tag才会被编码。如:
v [1]IMPLICIT INTEGER ::= -38的编码为:
(2).如果一个类型的Tag是显式(EXPLICIT)的(或者在模块定义中声明了EXPLICITTAGS),则要以constructed方式编码三元组系列。
如v[APPLICATION 0] EXPLICIT INTEGER ::= 38的编码为:
17.子类型约束
子类型约束是在BER编码规则之后被引入ASN.1的,在编码规则中不能体现约束。
18.EXTERNAL
该类型不推荐使用,略。
19.INSTANCEOF
定义为:
vINSTANCE OF TYPE-IDENTIFIER ::=
{
type-id{iso member-body f(250) type-org(1) ft(16) asn1-book(9)
chapter18(5)integer- type(0)},
valueINTEGER:5
}
的编码应当和如下一个SEQUENCE类型的值类似:
{
direct-reference{iso member-body f(250) type-org(1) ft(16) asn1-book(9)
chapter18(5)integer-type(0)},
encodingsingle-ASN1-type:INTEGER:5
}
编码为:
为什么valueINTEGER:5的编码采用constructed方式,处层TLV的Tag为上下文类型,值为0?
20.EMBEDDEDPDV
EMBEDDEDPDV的编码和其等效的SEQUENCE结构编码类似。其嵌入部分的编码,应该是遵循identification成员指定的规则。
21.CHARACTERSTRING
CHARACTERSTRING的编码和其等效的SEQUENCE结构编码类似。其嵌入字符串部分的编码,应该是遵循identification成员指定的规则。
22.InformationObjects and Object Sets
信息对象和对象集合永远都不编码。如前所述,传递他们所包含信息的途径是在值定义或者类型定义中引用他们。这样的结果,不是在编码中出现了这些信息,而是ASN.1编译器在生成编解码器时,会按照这些信息生成相应的约束表。
23.ValueSet
值集合的编码按照对应类型的编码规则进行。
三.BER编码规则的属性
1.BER编码规则是机器无关
2.BER的传输语法是十分冗长。
T和L很多情况下都是可以省略,但是这种冗余信息能很好的保藏抽象语法结构。
3.BER传输语法能容易升级而且向上兼容。如每个类型都可以用CHOICE来代替