在语音识别,数据传输等多方面领域通常会出现文件为我们不想要的进制,这个时候就可以用python强悍的数据处理能力来帮助我们。
第一步就是读取文件,这里以十六进制示例
all_data = []
for path in self.bin_path:
with open(path, 'r') as f:
for i in f.readlines():
all_data.append(i.strip('\n'))
(温馨提示:python在打开文件时自带二进制文件打开模式,如果源文件是二进制形式将使工作减少很多)
第二部数据处理
with open(out_txt_path, 'a') as new_f:
for i in all_data:
i = i.strip()
B_i = eval(f"b'{i}'")
each = bin(int(str(''.join(["%02X" % x for x in B_i]).strip()), 16))[2:]
new_f.write(str(each) + '\n')
print(f'{out_txt_path}: is done')
在这里注意一下,十六进制数据有的长这样
\x00\x80\x02\x00\x00\xe0\x01\x00\x00\x00\xb0\x04\x00\xf8\x12\xf1
有的长这样
12A32B
当然下面这种最好处理了,甚至用python自带的int都可以转换(其实其他进制也可以通过int转换)
但是如果是上面那种,就需要处理了
其中在处理这个问题的时候我遇到一个难题。
with open(path, 'r') as f:
在读取文件时,读取出来的是字符串str,而''.join(["%02X" % x for x in B_i]必须是bytes形式,即b''(带有b开头的字符串),但是在转成bytes的过程中总是出错,最后想起python还有eval()这个高级东西,于是毫不犹豫的用上,直接成功。
条条道路通罗马,是吧