20. 处理二进制文件

例如,wav是一种音频文件的格式,音频文件为二进制文件。wav文件由头部信息和音频采样数据构成。前面为头部信息,包括声道数、采样频率、编码位宽等,后面是音频采样数据。

要求:使用Python,分析一个wav文件头部信息,处理音频数据。

解决方案:

通过内置函数open()指定mode参数为rb,以二进制模式读取二进制文件。

解析二进制数据可以使用标准库中的struct.unpack()方法。


  • 对于open()函数:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

打开file并返回对应的file object。如果该文件不能打开,则触发OSError

可用的模式有:

mode意义
‘r’读取(默认)
‘w’写入,并先截断文件
‘x’排它性创建,如果文件已存在则失败
‘a’写入,如果文件已存在则在末尾追加
‘b’二进制模式
‘t’文本模式(默认)
‘+’更新磁盘文件(读取并写入)
  • 对于struct.unpack()函数:
struct.unpack(format, buffer)

根据格式字符串format从缓冲区buffer解包(假定是由pack(format, …)打包)。结果为一个元组,即使其只包含一个条目。缓冲区的字节大小必须匹配格式所要求的大小。


  • 方案示例:
import struct

def find_subchunk(f, name):
    f.seek(12)              #wav文件第一块大小为12
    
    while True:
        chunk_name = f.read(4)
        chunk_size, = struct.unpack('i', f.read(4))             #i表示int类型,4字节

        if chunk_name == name:
            return f.tell(), chunk_size

        f.seek(chunk_size, 1)               #1代表从当前位置开始算起

f = open('demo.wav', 'rb')
offset, size = find_subchunk(f, b'data')                #查看开头到data部分的指针偏移量,及data大小
print(offset, size, offset + size, end=' ')               #offset+size为该demo.wav文件总大小

118 31684608 31684726               #结果

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值