<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);"> </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">TIMIT之后,这次来分析Librispeech的词频,文件组织结构如图所示:</span>
librispeech文件夹下的dev-clean中含有多个多级子文件夹,每个末节文件夹下含有一个txt含有抄本外加多个音频文件是该抄本的朗读:
脚本任务是对所有txt抄本读取其中的词数并作统计,抄本内容样例如下
其中<