Intel HEX文件格式规范

对Intel HEX目标文件规范做了翻译。能力有限,仅供参考,翻译不当之处欢迎留言指正。

1、介绍

本文档介绍了Intel 8位,16位和32位的微处理器使用的HEX文件格式。 该HEX格式文件可用于PROM编程器或硬件模拟器。

HEX文件格式是一种使用ASCII编码表示二进制文件的一种方式。使用ASCII编码代替二进制存储,可以存储在非二进制存储介质上,如纸带、打孔卡等;并且这个文件能够显示在CRT终端,行式打印机等。8-bit的HEX格式文件可以使用16-bit的线性地址空间存放Intel 8-bit处理器的代码数据。16-bit的HEX格式文件可以使用20-bit的段地址空间存放Intel16-bit处理器的代码数据。32-bit HEX格式文件允许使用32-bit的线性地址空间存放Intel 32-bit处理器的代码数据。

二进制的十六进制表示形式以ASCII字母数字字符编码。例如,8-bit的二进制数据0011-1111在16进制中表示为3F。 要用ASCII编码,一个8-bit包含字符’3’的ASCII码(0011-0011或033H)和一个包含8位字节的8位字节字符“ F”(0100-0110或046H)的ASCII码是必需的。 对于每个字节值,高阶十六进制数字始终是十六进制数字对中的第一位。 此表示形式(ASCII十六进制)需要的字节数是二进制表示形式的两倍。

HEX文件由记录组成,每个记录都包含记录类型,长度,存储器加载地址和数据的校验和。 当前有6种不同类型的记录格式被定义。但是,这些记录的组合并不是都有意义的。 记录类型如下:

  • 数据记录(Data Record)(8-,16-,32-bit格式)
  • 文件结束记录(End of File Record)(8-,16-,32-bit格式)
  • 扩展段地址记录(Extended Segment Address Record)(16-,32-bit格式)
  • 开始段地址记录(Start Segment Address Record)(16-,32-bit格式)
  • 扩展线性地址记录(Extended Linear Address Record)(32-bit格式)
  • 开始线性地址记录(Start Linear Address Record)(32-bit格式)

2、一般记录格式

General Record Format
每个记录都以一个包含03AH的RECORD MARK字段开始,ASCII表示为‘:’字符。

每个记录都有一个RECLEN字段,用来表示指定信号或RECTYP字段后数据的字节数。注意,一个数据字节使用两个ASCII字符表示。这个RECLEN字段能够表示的最大值为FFH或255。

每个记录都有一个LOAD OFFSET字段,用来描述数据字节16-bit起始地址的偏移量,因此这个字段只在数据记录中使用。不使用该字段的其他记录,应该被编码为4个ASCII零字段(‘0000’或030303030H)。

每个记录有一个RECTYP字段,用来指定该记录的记录类型。这个RECTYP字段用来解释记录中的其他信息。当前编码的记录类型有:

  • ‘00’ Data Record
  • ‘01’ End of File Record
  • ‘02’ Extended Segment Address Record
  • ‘03’ Start Segment Address Record
  • ‘04’ Extended Linear Address Record
  • ‘05’ Start Linear Address Record

每个记录都有一个有效长度字段INFO/DATA,它由0个或多个16进制编码的字节组成。这个字段的信息根据RECTYP字段解释。

每个记录都以CHKSUM字段结束,这个字段使用从RECLEN字段(包括RECLEN字段)到INFO/DATA最后一个字节的数据累加和补码的ASCII字符的16进制编码表示。因此,从RECLEN字段(包括)到CHKSUM字段(包括)的ASCII编码转换为二进制后,数据累加和为0。

3、扩展线性地址记录(32-bit format only)

Extended Linear Address Record
32-bit扩展线性地址记录被用于指定线性基址(LBA)的16-31位,其中LBA的0-15位为0。LBA的16-31位被称为上线性地址(ULBA)。后续数据记录中的内容字节的绝对存储地址为LBA加上数据记录中的LOAD OFFSET字段的偏移量及数据记录中字节数据的索引(0,1,2,…n)。这个偏移计算是做模4G(即32bit),忽略任何进位,从而实现偏移回绕加载(从0FFFFFFFFH到000000000H),这个4G从开始到结尾的偏移回绕范围由LBA决定。加载特定字节的线性地址计算公式为:
(LBA + DRLO + DRI)MOD 4G
其中:
DRLO是数据记录中的LOAD OFFSET字段。
DRI是数据记录中数据字节的索引。

当扩展线性地址LBA被定义时,它将会被应用在32-bit HEX文件的任何地方。这个值将保持有效,直到遇到下个扩展线性地址记录。这个LBA默认为0,直到遇到扩展线性地址记录。

这个记录中各字段的内容是:
RECORD MARK:
这个字段包含03AH,是ASCII编码的字符‘:’的16进制编码。
RECLEN:
该字段包含03032H,ASCII字符“ 02”的十六进制编码,即该记录内ULBA数据信息的长度(以字节为单位)。
LOAD OFFSET:
此字段包含030303030H,ASCII字符“ 0000”的十六进制编码,此字段未用于该记录。
RECTYP:
此字段包含03034H,ASCII字符“ 04”的十六进制编码,表明该记录类型为扩展线性地址记录。
ULBA:
该字段包含四个ASCII十六进制数字,它们指定高16位线性地址。 高位字节是记录的第10个/第11个字符对。 低阶字节是记录的第12/13个字符对。
CHKSUM:
该字段包含RECLEN,LOAD OFFSET,RECTYP和ULBA的数据校验和。

4、扩展段地址记录(16- or 32-bit formats)

Externed Segment Address Record
16-bit扩展段地址记录用于指定段基地址的4-19位(SBA),其中SBA的0-3位为0。SBA的4-19位称为上段基址(USBA)。后续数据记录中内容字节的绝对地址为SBA加上数据记录中的LOAD OFFSET,及数据记录中数据的索引(0,1,2,…n)。这个偏移计算做模64K(即16位),忽略进位,从而实现偏移回绕加载(从0FFFFH到00000H),这个64K从开始到结尾的偏移回绕范围由SBA决定。加载特定字节的地址计算公式为:
SBA + ([DRLO + DRI] MOD 64K)
其中:
DRLO为数据记录中的LOAD OFFSET字段。
DRI为数据记录中数据的索引。
当扩展段地址通过SBA被定义,它将会被应用在16-bit HEX文件的任何地方。这个值将保持有效直到遇到下一个扩展段地址记录。这个段扩展地址默认为0,直到遇到扩展段地址记录。

这个记录中个字段的内容为:
RECORD MARK:
这个字段包含03AH,是ASCII编码的字符‘:’的16进制编码。
RECLEN:
该字段包含03032H,ASCII字符“ 02”的十六进制编码,即该记录内ULBA数据信息的长度(以字节为单位)。
LOAD OFFSET:
此字段包含030303030H,ASCII字符“ 0000”的十六进制编码,此字段未用于该记录。
RECTYP:
此字段包含03032H,ASCII字符“ 02”的十六进制编码,表明该记录类型为扩展段地址记录。
USBA:
该字段包含四个ASCII十六进制数字,它们指定高16位段基地址的值。 高位字节是记录的第10个/第11个字符对。 低阶字节是记录的第12/13个字符对。
CHKSUM:
该字段包含RECLEN,LOAD OFFSET,RECTYP和USBA的数据校验和。

5、数据记录(8-, 16-, or 32-bit formats)

Data Record
数据记录使用16进制数字的ASCII编码表示数据内容,组成存储镜像的一部分。计算数据内容绝对地址(8-bit和32-bit线性,16-bit分段)的方法可以参考扩展线性地址记录和扩展段地址记录。

这个记录中个字段的内容为:
RECORD MARK:
这个字段包含03AH,是ASCII编码的字符‘:’的16进制编码。
RECLEN:
这个字段包含两个ASCII编码的16进制数字,说明数据字节在记录中的长度。这个字段的最大值为‘FF’或04646H(十进制255)。
LOAD OFFSET:
该字段包含四个ASCII编码的16进制数字,说明相对LBA(请参见扩展线性地址记录)或SBA(请参见扩展段地址记录)后放置数据第一个字节的地址。
RECTYP:
此字段包含03030H,ASCII字符“ 00”的十六进制编码,表明该记录类型为数据记录。
DATA:
该字段包含成对的ASCII编码的16进制数字,每个数据字节由一对ASCII字符标表示。
CHKSUM:
该字段包含RECLEN,LOAD OFFSET,RECTYP和DATA的数据校验和。

6、开始线性地址记录(32-bit format only)

Start Linear Address Record
开始线性记录用来记录指定目标文件的执行起始地址。这个值是EIP寄存器中的32-bit的线性地址记录。注意,这个记录仅指定代码地址在80386的32-bit线性地址空间中。如果代码要在实数中开始执行80386模式,则应改用“起始段地址记录”,因为该记录指定实模式所需的CS和IP寄存器内容。

起始线性地址记录可以出现在32位十六进制目标文件中的任何位置。 如果在十六进制目标文件中不存在记录的情况下,加载程序可以自由分配默认的起始地址。

这个记录中个字段的内容为:
RECORD MARK:
这个字段包含03AH,是ASCII编码的字符‘:’的16进制编码。
RECLEN:
该字段包含03034H,ASCII字符’04’的十六进制编码,表示记录中EIP寄存器数据的长度。
LOAD OFFSET:
该字段包含030303030H,ASCII字符’0000’的十六进制编码,此字段未用于该记录。
RECTYP:
该字段包含03035H,ASCII字符‘05’的十六进制编码,表明该记录为开始线性地址记录。
EIP:
此字段包含8个ASCII的十六进制编码,用于指定32位EIP寄存器的内容。高位字节是第10 / 1l个字符对。
CHKSUM:
该字段包含RECLEN,LOAD OFFSET,RECTYP和EIP的数据校验和。

7、开始段地址记录(16- or 32-bit formats)

Start Segment Address Record
起始段地址记录用于指定目标文件的执行起始地址。这个起始地址由是CS和IP寄存器的20位段地址给定。 注意,此记录仅指定8086/80186的20位分段地址空间内的代码地址。

起始段地址记录可以出现在16位十六进制目标文件中的任何位置。 如果在十六进制目标文件中不存在记录的情况下,加载程序可以自由分配默认的起始地址。

记录中各个字段的内容为:
RECORD MARK:
这个字段包含03AH,是ASCII编码的字符‘:’的16进制编码。
RECLEN:
该字段包含03034H,ASCII字符’04’的十六进制编码,表示记录中CS/IP寄存器数据的长度。
LOAD OFFSET:
该字段包含030303030H,ASCII字符’0000’的十六进制编码,此字段未用于该记录。
RECTYP:
该字段包含03033H,ASCII字符‘03’的十六进制编码,表明该记录为开始段地址记录。
CS/IP:
该字段包含8个ASCII字符的十六进制编码,分别指定16位CS寄存器和16位IP寄存器内容。 CS寄存器内容的高位字节为记录的第10 / ll个字符对,低位字节为记录的第12/13个字符对。 IP寄存器内容的高位字节为记录的第14/15个字符对,低位字节为记录的第16/17个字符对。
CHKSUM:
该字段包含RECLEN,LOAD OFFSET,RECTYP和CS/IP的数据校验和。

8、文件结束记录(8-, 16-, or 32-bit formats

End of File Record
该记录表示HEX目标文件的结束。

这个记录中个字段的内容为:
RECORD MARK:
这个字段包含03AH,是ASCII编码的字符‘:’的16进制编码。
RECLEN:
该字段包含03030H,ASCII字符’00’的十六进制编码。因此该记录并没有包含内容INFO/DATA数据字节,这个长度为0。
LOAD OFFSET:
该字段包含030303030H,ASCII字符’0000’的十六进制编码,此字段未用于该记录。
RECTYP:
该字段包含03031H,ASCII字符‘01’的十六进制编码,表明该记录为文件结束记录。
CHKSUM:
该字段包含RECLEN,LOAD OFFSET和RECTYP数据校验和。因为所有的字段是固定的,所以校验和也是固定的,校验和为04646H,即ASCII字符‘FF’的十六进制编码。

### 回答1: VC Hex文件格式解析是指对VC(Version Control)系统中的Hex文件进行解析和分析的过程。 首先,VC是一种用于版本控制和代码管理的工具,它采用二进制格式的Hex文件来存储源码、修改记录和版本信息等。Hex文件是一种十六进制形式的文本文件,可以通过特定的解析算法将其转换为可读的源代码或其他文件。 在解析VC Hex文件时,我们需要了解其基本结构和格式。Hex文件通常由多个记录(Record)组成,每个记录包含了不同的类型和数据内容。常见的记录类型包括:数据记录、扩展段地址记录、起始段地址记录和结束记录等。 数据记录包含了实际的源代码或其他数据信息,其格式包括起始地址、数据长度、数据内容和校验和等。扩展段地址记录用于扩展程序的地址空间,起始段地址记录指定程序的入口地址,结束记录表示文件结束。 在解析过程中,我们需要按照记录的格式和顺序读取Hex文件,并根据记录类型对数据进行处理。例如,对于数据记录,我们可以根据起始地址和数据长度将数据写入相应的内存空间或文件中。 解析VC Hex文件的目的是为了能够获取其中的源代码、版本信息或其他相关数据,以便进行版本对比、回滚或其他操作。通过解析Hex文件,我们可以还原出之前的代码状态或版本,并根据需要进行相应的操作。 总而言之,VC Hex文件格式解析是一项对VC系统中的Hex文件进行结构分析和数据提取的过程,通过解析该文件,我们可以获取其中的源代码和版本信息,并进行相应的版本管理和控制。 ### 回答2: VC Hex文件格式是一种常见的存储二进制数据的文件格式。它通常被用于将机器语言代码、固件、软件等以十六进制的形式存储在计算机中。 VC Hex文件格式解析的过程主要包括以下几个方面: 1. 文件结构:VC Hex文件由多行文本组成,每行包含一条记录。每条记录通常由一个冒号开始,后面跟着一系列十六进制数值,用于表示数据。记录的具体格式按照规定的标准进行编码。 2. 记录类型:VC Hex文件的记录有多种类型,包括数据记录、扩展段地址记录、起始段地址记录、起始线性地址记录等。根据记录类型的不同,记录中的数据和含义也会有所差异。 3. 数据内容:VC Hex文件中的数据记录包含机器语言指令、数据、校验和等。数据记录的具体内容由记录类型和记录长度决定,它们被以十六进制的形式表示。 4. 校验和:每条记录都包含一个校验和字段,用于验证记录的完整性和准确性。校验和一般为记录中所有数据的和的补码。 解析VC Hex文件时,可以通过逐行读取文件内容,并根据每行的格式和记录类型,提取出需要的数据和信息。根据记录类型的不同,可以按照规定的格式解析出相应的数据,如地址、校验和等。对于数据记录,可以将每个记录中的数据转换为二进制形式,并根据需要进行后续处理或使用。 总之,解析VC Hex文件格式需要了解文件结构、记录类型、数据内容和校验和等方面的知识。通过逐行解析文件内容,可以获得其中存储的数据和相关信息,进而进行后续处理和使用。 ### 回答3: VC Hex文件格式是一种用来描述微控制器程序存储的十六进制文件格式。它将程序的机器码以十六进制形式进行编码,并且以特定的格式进行排列和存储。 在VC Hex文件中,每一行都包含了一定数量的数据。这些数据通常表示机器指令、数据或其他相关信息。每一行的开头通常包含了该行的地址信息,用于标记数据所在的内存地址。而紧接着的数据则是该地址处的值。 VC Hex文件的地址通常是以16位或32位的形式表示的,这取决于所使用的微控制器架构。地址信息的具体格式也可能会有所不同,但通常都会包含一个地址字节数和一个地址校验和。 除了地址和数据之外,VC Hex文件还可能包含一些其他的特定指令,例如起始地址指令和结束地址指令。这些指令用于标记程序执行的起始地址和结束地址,以便于加载和执行程序。 解析一个VC Hex文件的过程通常涉及以下几个步骤: 1. 读取文件并逐行解析每个数据记录。 2. 提取地址信息和数据值,并进行必要的校验。 3. 根据地址信息将数据值存储到对应的内存地址中。 4. 根据特定指令解析起始地址和结束地址,以确定程序的入口点和结束点。 总的来说,VC Hex文件格式解析是将这些十六进制数据按照特定规则进行解析和存储的过程,以便于加载和执行微控制器的程序。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值