ANS.1笔记:语法规则与类型概述-CSDN博客

本文链接：https://blog.csdn.net/fuluoce/article/details/120283638

本文深入解析了ASN.1的基本语法规则，包括数据类型、编码规则和模块定义，阐述了它在定义数据结构、编码传输和标准化协议中的作用。了解ASN.1有助于开发者构建高效、一致的通信协议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、简介

ASN.1(Abstract Syntax Notation dotone),抽象语法标记1。是定义抽象数据类型形式的标准,是用于描述数据表示、表示、传输、编码的记法。

ASN.1只包含信息结构，不处理具体业务数据，它不是一个编程语言。

ASN.1没有限定编码方法，各种ASN.1编码规则提供了由ASN.1描述其抽象句法的数据的值的传送语法（具体表达），常见的编码规则有：

1、基本编码规则(BER),规范编码规则（CER，CanonicalEncoding Rules）、
2、唯一编码规则（DER，DistinguishedEncoding Rules）、
3、压缩编码规则（PER，PackedEncoding Rules）
4、XML编码规则（XER，XMLEncoding Rules）。

这些编码规则描述了如何将定义在ASN.1中的值译成适合传输的电码。

(1)实际语法

指诸如C、ObjectiveCaml等这样实际编程语言；

(2)抽象语法（AbstractSyntax）

指ASN.1，是协议采用ASN.1规范描述的描述文本。描绘了与任何表示数据的编码技术无关的通用数据结构。抽象语法使得人们能够定义数据类型，并指明这些类型的值。抽象语法只描述数据的结构形式，与具体的编码格式无关，同时也不涉及这些数据结构在计算机内如何存放。

(3)传输语法（TransferSyntax）

指表示层交换数据的表示方法，是实际通讯系统间的码流。当数据在两个表示层实体之间传输时，这些数据的实际比特模式表示方法就是传送语法。

(4)编码

指将抽象语言法转换成实际通讯系统间比特流;

(5)编码规则

将抽象语言法转换成实际通讯系统间比特流所遵循的语法规则;

二、ASN.1的基本语法规则

1、ASN.1使用巴科斯范式(BNF):

在双引号中的字("word")代表着这些字符本身。而double_quote用来代表双引号。
在双引号外的字（有可能有下划线）代表着语法部分。
尖括号(< > )内包含的为必选项。
方括号([ ] )内包含的为可选项。
大括号({ } )内包含的为可重复0至无数次的项。
竖线(| )表示在其左右两边任选一项，相当于"OR"的意思
::=是“被定义为”的意思。
在ASN.1中，符号的定义没有先后次序：只要能够找到该符号的定义即可
所有的标识符、参考、关键字都要以一个字母开头，后接字母(大、小写都可以)、数字或者连字符“-”(但不能以连字符“-”结尾，也不能连续出现两个连字符)，不能出现下划线“_”。
关键字一般都是全部大写。
在标识符中，只有类型和模块名字是以大写字母开头的，其它标识符都是以小写字母开头。
ASN.1中实数实际定义为三个整数：尾数、基数和指数。没有小数表示方式。
ASN.1不对空格、制表符、换行符和注释做翻译。但是在定义符号（或者分配符号Assignment）“::=”中不能有分隔符

这是用BNF来定义的Java语言中的For语句的实例：

　　FOR_STATEMENT::=

　　"for""(" ( variable_declaration |

　　(expression ";" ) | ";" )

　　[expression ] ";"

　　[expression ]

　　")"statement

三、ASN.1中的类型

1、ASN.1中的类型

ASN.1中的类型分为基本类型(内建数据类型)和组合类型，组合类型由一个或多个基本类型构成。

基本类型

类型	含义
NULL	只包含一个值NULL，用于传送一个报告或者作为CHOICE类型中某些值
INTEGER	全部整数（包括正数和负数）
REAL	实数，表示浮点数
ENUMERATED	标识符的枚举（实例状态机的状态）
BITSTRING	比特串
OCTETSTRING	字节串
OBJECT IDENTIFIER, RELATIVE-OID	一个实体的标识符，它在一个全世界范围树状结构中注册
EXTERNAL,EMBEDDED PDV	表示层上下文交换类型
…String(除了BITSTRING、OCTETSTRING外)	各种字符串，有NumericString、PrintableString、VisibleStirng、ISO64String、IA5String、TeletexStirng、T61String、VideotexString、GraphicString、GeneralString、UniversalString、BMPString和UTF8String
CHARACTERSTRING	允许为字符串协商一个明确的字符表
UTCTime,GeneralizedTime	日期

组合类型

类型	含义
CHOICE	在类型中选择(相当于C中的联合)
SEQUENCE	由不同类型的值组成一个有序的结构(相当于C中的结构体)
SET	由不同类型的值组成一个无序的结构
SEQUENCEOF	由相同类型的值组成一个有序的结构(相当于C中的数组)
SETOF	由相同类型的值组成一个无序的结构

2、类型定义

<新类型的名字>::= <类型描述>

例：

Married ::= BOOLEAN

Age ::= INTEGER

Picture ::= BIT STRING

Form ::= SEQUENCE

{

name PrintableString,

age Age,

married Married,

marriage-certificate PictureOPTIONAL

}

Married类型是一个基本类型BOOLEAN，Form类型是一组基本类型的有序序列

注意：在SEQUENCE和SET等(好像应该是所有组合类型的)定义中，最后一个成员结尾没有逗号“,”。

为了接收方能正确解码，发送方为每个值的类型附加一个数，称为tag，在描述中以“[]”标识。缺省情况下，编码器会使用universal的tag。在给合类型中，为了明确各个成员，有必要指明每个成员的Tag：

Coordinates ::= SET

{

x [1] INTEGER, //这证明好像也可以用类来直接声明变量

y [2]INTEGER,

z [3]INTEGER OPTIONAL

}

Tag会在传输规则使用到，用于在比特流中指明数据的具体类型。

为了准确描述一个类型，我们需要对值的集合进行一定的限制。这用到子类型约束，在类型之后用圆括号进行标识。

如：

Lottery-number::= INTERGER(1..49)  //表示取1-49任一一个值

Lottery-draw ::=SEQUENCESIZE(6) OF Lottery-number  //指定了该SEQUENCE类型由6个Lottery-number类型有序组成。

Upper-case-words::= IA5String (FROM(“A”..”Z”))   //表示按ASCII取A-Z中任一一个，IA5String是ASCII字符串类型

为了方便在新的版本中往现有类型中添加新成员，可用“…”来标记可能以后是其它类型的地方：

Type ::= SEQUENCE

{

component1 INTERGER,

component2 BOOLEAN,

…

}

以后新的版本中，描述可能为：

Type ::= SEQUENCE

{

component1 INTERGER,

component2 BOOLEAN,

…,

[[component3REAL]], -- version 2

…

}

注意：新加入的类型成员要嵌套在“[[]]”中,--version 2指定新版本号

3、定义值

<新的值的名字><该值的类型> ::=<值描述>

<新的值的名字>是以小写字母开头的标识符；
<该值的类型>可以是一个类型的名字，也可以是类型描述；
<值描述>是基于整数、字符串、标识符的组合。

如：

counter Lottery-number ::= 45

sextuple Lottery-draw ::= { 7, 12, 23, 31, 33, 41 }

4.信息对象类和信息对象

<信息对象类>::= CLASS <类描述>

WITHSYNTAX <信息描述>

用于表达比注释更为正式的一些信息

5.模块定义

<模块名字> DEFINITIONS <缺省Tag>::=

BEGIN

EXPORTS <导出描述>

IMPORTS <导入描述>

<模块体描述>

END

一般协议由一个或者多个模块组成，模块用来收集数据结构定义。

模块名字必须以大写字母开头。模块能以一种“全局指针”(UniversalPointer)的方式来引用，称为对象标识符（ObjectIdentifier），用花括号标识在名字之后。

如：

Module2 { isomember-body(2) f(250) type-org(1) ft(16)

asn1-book(9)chapter5(0) module2(1) }

DEFINITIONS AUTOMATICTAGS ::=

BEGIN

EXPORTS Type2;

IMPORTS Type1, valueFROM Module1 {iso member-body(2)

f(250) type-org(1)ft(16) asn1-book(9) chapter5(0) module1(0)};

Type2 ::= SEQUENCE OFChoice

Choice ::= CHOICE

{

a INTEGER (0..value),

b Type1

}

END

(1).AUTOMATICTAGS是指缺省Tag，说明不关注模块的Tag。

(2).IMPORTS声明在其它模块定义但在本模块会用到的类型或者值。

EXPORT声明在本模块之外可以访问的类型或者值。

IMPORTS的语法为：

IMPORTS <名字>,value FROM <其它模块的ObjectIdentifier >;

EXPORTS的语法为：

EXPORTS<名字>;

(3).对象标识符(OBJECTIDENTIFIER,OID)类型用层次的形式来表示标准规范。标识符树通过一个点分的十进制符号来定义，这个符号以组织，子部分然后是标准的类型和各自的子标识符开始．

例如：MD5的OID是1.2.840.113549.2.5表示为"iso(1)member-body (2) US (840) rsadsi(113549) digestAlgorithm (2) md5 (5)",所以当解码程序看到这个OID时,就知道是MD5散列。

OID在公钥算法标准中很流行,它指出证书绑定了哪种散列算法。

OID在传输时编码规则: