tf15: 中文语音识别

最新推荐文章于 2025-05-25 18:09:55 发布

MachineLP

最新推荐文章于 2025-05-25 18:09:55 发布

阅读量2.6w

点赞数 10

CC 4.0 BY-SA版权

分类专栏：机器学习 Deep learning TensorFlow练习汇总文章标签： Tensorflow

本文链接：https://blog.csdn.net/u014365862/article/details/53869701

TensorFlow练习汇总同时被 3 个专栏收录

49 篇文章 ¥39.90 ¥99.00

订阅专栏

机器学习

292 篇文章

订阅专栏

Deep learning

175 篇文章

订阅专栏

本文介绍了如何利用Tensorflow构建中文语音识别系统，参考了THCHS30数据集和开源项目。通过下载该数据集，可以进行语音识别系统的开发。后续内容将涉及从麦克风获取语音并进行识别的实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用的数据集

THCHS30是Dong Wang, Xuewei Zhang, Zhiyong Zhang这几位大神发布的开放语音数据集，可用于开发中文语音识别系统。

为了感谢这几位大神，我是跪在电脑前写的本帖代码。

可以参考这个，tql: https://github.com/xxbb1234021/speech_recognition

下载中文语音数据集（5G+）：

#coding: utf-8  
import tensorflow as tf  
import numpy as np  
import os  
from collections import Counter  
import librosa  
  
from joblib import Parallel, delayed  
  
wav_path = 'data/wav/train'  
label_file = 'data/doc/trans/train.word.txt'
  
def get_wav_files(wav_path = wav_path):  
    wav_files = []  
    for (dirpath, dirnames, filenames) in os.walk(wav_path):  
        for filenam

了解本专栏