python批量读取某文件夹下所有语音文件的总时长

1.需求

在进行语音相关方面的研究的时候,我们就需要统计一下我们各个文件夹下所有语音文件的总长度,但是一个一个的进行计算难免有些麻烦,想着有没有可以使用python批量化计算每个文件夹下的所有语音时长,于是便有了下边的这个代码。

2.Python批量获取指定文件夹下所有语音总时长

此处将代码公式,希望可以帮助到其他人。

import os
import wave

def file_name(file_dir):
    '''
    输入文件夹名称,并返回该文件夹下所有语音文件的完整路径(list类型)
    :param file_dir: 
    :return: 
    '''
    L = []
    for root, dirs, files in os.walk(file_dir):
        for file in files:
            if file.split('.')[-1] == 'wav':
                L.append(os.path.join(root, file))
        return L


def cal_total_time(file_dir):
    '''
    计算输入文件夹内所有语音文件的时间长度
    :param file_dir:
    :return:
    '''
    time_count=0
    wav_list=file_name(file_dir)
    for wav_path in wav_list:
        with wave.open(wav_path, 'rb') as f:
            f = wave.open(wav_path)
            time_count += f.getparams().nframes / f.getparams().framerate

    return time_count/60/60

def main():
    file_dirs=[r'I:/王延凯新建LibriVox数据集/english',
               'I:/王延凯新建LibriVox数据集/French',
               'I:/王延凯新建LibriVox数据集/German',
               'I:/王延凯新建LibriVox数据集/Italian',
               'I:/王延凯新建LibriVox数据集/Spanish']

    for file_dir in file_dirs:
        print('当前语种时长为:%.2f 小时'%(cal_total_time(file_dir)))

if __name__ == '__main__':
    main()

3.运行结果

在这里插入图片描述

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王延凯的博客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值