前言:由于最近有项目需求,需要对采集回来的数据进行解析和处理,而源数据是十六进制格式的,但是由于python3将字节和字符串有了更为严格的区分,所以不能直接对数据进行readline,需要进一步的处理。
下面是具体的处理步骤:
1、十六进制文件的读取
首先是从文件中读取十六进制的数据:
如果我们直接像从txt文件中读取数据那样(readlines)按行进行读取是行不通的,因为按行读取的是字符串,我们文件中存储的是字节,所以字节会被按照编码方式自动的转换成对应的字符串,但是我们的数据中不仅仅只有英文字符,更多的还是数值数据,因此很多字符会超出编码的范围,因此直接这样进行解析会报出很多错误说某一字符无法解析。
所以我们需要换一种读取方式,file中有一种read的方式,可以设置每次读取一个字节,eg:上图中的 6f 就是一个字节,而 6f63 就是两个字节。对应的读取代码:
data=[] # 读取文件,先解析成十六进制进行保存
while True: # 可以取得每一个十六进制
a=file.read(1) # read(1)表示每次读取一个字节长度的数值
if not a:
break
else:
if(ord(a)<=15):
data.append(("0x0"+hex(ord(a))[2:])[2:]) #前面不加“0x0”就会变成eg:7 而不是 07
else:
data.append((hex(ord(a)))[2:]) # 最终得到的就是十六进制的字符串表示,便于后续处理
最终我们得到的是一个list,list中的元素都是str类型的,方便读取和后续的转换。
data数据:
2、数据处理-补码转换
在处理十六进制数据时,我们常常遇到的一个问题就是如何将十六进制转换后为十进制,特别是有特殊要求的格式转换,我这里就遇到了一个特殊要求的转换。
转换要求:一个数值由16位二进制来表示,高低位进行交换操作,并且是补码表示,比如:
4C F7 表示的是F7 4C
将F7 4C表示为二进制,由于最高位为1 所以是负数,
F7 4C 取反加1 再转换为十六进制为 08 B4 十进制为 2228,那么最终就是 -2228
data1='4c'
data2='f7'
final=data2+data1
#final='f74c' # 十六进制的补码转换
if int(final[0],16)>7:
volt=((int(final,16))^(int('ffff',16)))+1
volt=volt*(-1)
else:
volt=int(final,16)
volt=volt