python 5-2 如何处理二进制文件open(“test.wav”,”rb”)/struct.pack/unpack/array(‘h’,(0 for _ in xrange(n)))
解决方案:
open函数以二进制模式打开,指定mode 参数为 'b'
二进制数据可以通过readinto,读入到提前分配好的buffer中,便于数据处理,
buffer=array.array('i',(0 for _x in xrange(n)) 申请一片连续的为0的空间,数据类型是短整型
buffer.tofile(open("testNew.wav",'wb') 可以直接写入到二进制文件
解析二进制数据可以通过标准库中的struct模块的unpack方法
fr=open("test.wav",'rb')
info=fr.read()
struct.unpack("h",info[22:24])
处理
使用struct.unpack可以将二进制解开
import array
array('c','I love china') 这个是字符 第一个参数表示的哪种数据类型
buf=array('i','33') 是short 整型 数据类型
buf.tofile(open('test.txt','wb') 数组可以直接输出到文件
>>> help(struct.unpack)
Help on built-in function unpack in module _struct:
unpack(...)
Unpack the string containing packed C structure data, according to fmt.
Requires len(string) == calcsize(fmt).
>>>
>>> struct.unpack('h','\x01\x02')小字节序
(513,)
>>> struct.unpack('>h','\x01\x02') 大字节序
(258,)
>>>
FORMAT C TYPE PYTHON TYPE STANDARD SIZE NOTES
x pad byte no value
c char string of length 1 1
b signed char integer 1 (3)
B unsigned char integer 1 (3)
? _Bool bool 1 (1)
h short integer 2 (3)
H unsigned short integer 2 (3)
i int integer 4 (3)
I unsigned int integer 4 (3)
l long integer 4 (3)
L unsigned long integer 4 (3)
q long long integer 8 (2), (3)
Q unsigned long long integer 8 (2), (3)
f float float 4 (4)
d double float 8 (4)
s char[] string
p char[] string
P void * integer (5), (3)
分析二进制的文件 一般都需要用到seek 来定位文件的位置
f.seek(0,2) ==>将文件指针读到文件结尾
f.tell() ==>告诉当前文件位置
import struct
import array
f=open('test.wav','rb')
info=f.read(44)
print struct.unpack('h',info[22:24]) #(2,)
print struct.unpack('i',info[24:28]) #(44100,)
f.seek(0,2) #
print "total num is %d",f.tell() #报告文件位置
n=(f.tell()-44)/2 #读出文件除去文件头的内容
buf=array.array('h',(0 for _ in xrange(n)))
f.seek(44)
f.readinto(buf)
for i in xrange(n):
buf[i] /=8
fw=open('demo.wav','wb')
fw.write(info)
buf.tofile(fw)
fw.close()