python读取sphere语音文件

最新推荐文章于 2022-05-13 20:30:11 发布

王延凯的博客

最新推荐文章于 2022-05-13 20:30:11 发布

阅读量380

点赞数

分类专栏：语音识别文章标签： sphere wav 语音文件 python

本文链接：https://blog.csdn.net/weixin_38468077/article/details/115918063

版权

语音识别专栏收录该内容

15 篇文章 6 订阅

订阅专栏

在进行语音处理的时候，有时候需要处理sphere的语音文件，如果直接读取wav文件是无法读取出的，可以使用以下代码进行转换：

# coding = utf-8

import numpy as np
import ctypes


def read_sphere_wav(file_name):
    wav_file = open(file_name, 'rb')
    raw_header = wav_file.read(1024).decode('utf-8')
    raw_data = wav_file.read()
    sample_count = len(raw_data) // 2

    wav_data = np.zeros(shape=[sample_count], dtype=np.int32)

    for i in range(sample_count):
        wav_data[i] = ctypes.c_int16(ord(raw_data[2 * i + 1]) << 8).value + ctypes.c_int16(ord(raw_data[2 * i])).value

    header_list = raw_header.split("\n")
    sphere_header = {}
    for s in header_list:
        if len(s) > 0 and s != "end_head":
            tmp = s.split(" ")
            if len(tmp) < 3 and len(tmp) > 0:
                sphere_header['Name'] = tmp[0]
            elif len(tmp[0]) > 0:
                sphere_header[tmp[0]] = tmp[2]

    return wav_data, sphere_header


if __name__ == '__main__':
    wav_data, wav_header = read_sphere_wav(u"/media/neo/000C6F0F00042510/Doctor/dataset/TIMIT/train/dr1/fcjf0/sa1.wav")
    print(wav_data.shape)
    print(wav_header)
    print(wav_data[0:100])
    print(wav_data.min())
    print(wav_data.max())

王延凯的博客

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
python读取sphere语音文件

在进行语音处理的时候，有时候需要处理sphere的语音文件，如果直接读取wav问价是无法读取出的，可以使用以下代码进行转换：# coding = utf-8import numpy as npimport ctypesdef read_sphere_wav(file_name): wav_file = open(file_name, 'rb') raw_header = wav_file.read(1024).decode('utf-8') raw_data = wav
复制链接

扫一扫