最近由于各种用原因一直在跟python和二进制打交道,正好比赛中也有个用python处理二进制文件的题目,中间遇到了一个坑人的地方,这里总结记录下
题目中遇到的一个需求是对二进制文件中的每一个字节用0xff减去二进制值然后重新写出一个新的文件,我原本的代码是:
import struct
flag = open('Newflag.wav','wb')
with open('flag.wav','rb') as f:
for cry in f.read():
tmp = chr(0xff-cry)
flag.write(bytes(tmp, encoding='utf-8'))
flag.close()
其中的问题在于,当使用chr去转换小于127的值时是没有问题的,但是用处理大于127的值时,例如chr(192)这种,python会自动处理成utf-8的编码格式:
bytes(chr(127),encoding='utf-8')
b'\x7f'
bytes(chr(128),encoding='utf-8')
b'\xc2\x80'
所以当二进制文件中出现大于127的值时就会出现问题,为了将整型转换成bytes类型写入文件,推荐的用法为用struct的pack,可用的代码如下:
import struct
flag = open('Newflag.wav','wb')
res = []
with open('flag.wav','rb') as f:
for cry in f.read():
tmp = 0xff-cry
res.append(tmp)
for tmp in res:
flag.write(struct.pack('B',tmp))
flag.close()