语音识别（2）： kws项目实现、数据集代码分析

Yaxyy

已于 2023-03-14 09:28:13 修改

阅读量1.1k

点赞数

分类专栏：语音识别文章标签： python 开发语言

于 2023-02-18 11:02:19 首次发布

本文链接：https://blog.csdn.net/weixin_46216810/article/details/129048708

版权

语音识别（2）：KWS数据集代码分析

数据集分析

kws的语音数据为该数据集有 30 个短单词的 65000 个长度 1 秒钟的发音。

这是Google的一个语音数据集
下载地址：http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz
下载后得到文件 speech_commands_v0.01.tar.gz

训练集包含51088 个 wav 音频文件
验证集包含6798 个 wav 音频文件
测试集包含6835 个 wav 音频文件

pytorch音频官方文档

代码分析

1.Python strip()方法

str.strip([chars]);

返回移除指定字符串头尾指定的字符生成新的字符串。

print str2.strip();

删除空格

2.pushd 命令，了解一下！一个比 cd 更高效的目录切换命令
push 命令在输过不同的目录以后，再次更改只需要push +* 就好。

Linux中的pushd和popd
（1）popd不带参数，将目录栈的栈顶元素出栈
（2）popd + * 就是将目录栈中第**个目录删除。如果目录栈的栈顶元素没有发生变化，是不会导致当前的目录切换的。

3.with open(““,“r“) as file
为了更加严谨，在打开失败时不执行.close()操作。

with list_fullpath[split].open("

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Yaxyy

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

语音识别_ML-KWS-for-MCU_资料整理

学而时习之

11-06

3128

ML-KWS-for-MCU[1]是一个把Google的基于TensorFlow开源语音识别项目[2](Keyword spotting，简称KWS)应用于MCU上的实例，所以要了解ML-KWS-for-MCU之前首先了解这一开源项目(作者是Pete Warden,Google Brain Mountain View, California petewarden@google.com)。鉴于语...

（KWS-HMM）

01-06

会议：ICASSP-90 论文：A HIDDEN MARKOV MODEL BASED KEYWORD RECOGNITION SYSTEM 作者：Richard C Rose，Douglas B Paul ABSTRACT 提出了一种基于连续语音识别模型的独立于说话人的隐马尔可夫模型（HMM）关键字识别器（KWR）。描述了基线关键字识别系统，并讨论了处理非关键字语音和线性通道效果的技术。研究了声学模型的训练，以提供非词汇语音的显式表示。似然比评分程序用于说明影响关键字似然分数的可变性来源。依赖于声学类别的频谱归一化过程用于为线性通道效应提供显式补偿。具有20个关键字词汇的标准会话语音任务的关

参与评论您还未登录，请先登录后发表或查看评论

探索KWS-Training-Suite：阿里巴巴达摩院的智能语音识别神器

gitblog_00048的博客

04-21

779

探索KWS-Training-Suite：阿里巴巴达摩院的智能语音识别神器去发现同类优质开源项目:https://gitcode.com/ 项目简介在深入探讨之前，我们先来了解一下。这是一个由阿里巴巴达摩院发布的开源项目，专注于关键词搜索（Keyword Spotting, KWS）模型的训练和评估。KWS是语音识别技术的一个重要分支，主要用于设备上的即时唤醒或者触发特定命令。技术分析模型...

语音认别---唤醒技术KWS介绍

宁静以致墨的专栏

02-22

9936

语音认别---唤醒技术KWS介绍　　由于目前终端（如手机）上的CPU还不足够强劲，不能让语音识别的各种算法跑在终端上，尤其现在语音识别都是基于深度学习来做了，更加不能跑在终端上，所以目前主流的语音识别方案是声音采集和前处理在终端上做，语音识别算法则放在服务器（即云端）上跑。虽然这种方案有泄漏隐私（把终端上的语音数据发给服务器）和没有网络不能使用等缺点，但也是不得已而为之的，相信在不久的将来等终端上的CPU足够强劲了会把语音识别的所有实现都放在终端上的。　　是不是意味着终端上做不了语音识别相关的算法.

KWS语音识别技术简介

最新发布

weixin_47569031的博客

10-22

1144

KWS语音识别技术简介

基于WEKWS模型的语音唤醒关键词识别

YuZhou的博客

01-18

4103

本文所使用的模型网络结构继承自论文《Compact Feedforward Sequential Memory Networks for Small-footprint Keyword Spotting》，文中研究了将低秩矩阵分解与传统FSMN相结合的紧凑型前馈顺序记忆网络（cFSMN）用于远场关键字检测任务。

基于深度学习的语音关键词识别（KWS）Python训练代码带模型文件 res15 res8

08-06

# 基于深度学习的语音关键词识别（KWS）Python训练代码带...2. 包含训练和评测代码，训练在google speech commands数据集上实现； 3. 包含训练好的res15-narrow模型的pt权重文件，准确率达到95.6%，可用于评测和推理。

人工智能-语音识别-汉语连续语音识别中自适应技术的研究.pdf

06-27

本文从自适应技术在汉语连续语音识别中的研究与应用出发，系统地探讨了相关技术的发展，并深入分析了自适应技术对提升语音识别系统性能的作用。在探讨自适应技术之前，首先需要了解语音识别技术的背景和意义。语音...

一种语音识别和关键词识别的方法

12-28

本文介绍了一种语音识别和关键词识别的方法，并详细阐述了与之相关的一些关键概念，其中包括了低资源语音处理、不同语言的数据集、以及与Babel计划相关的内容。低资源语音处理通常指的是对那些训练数据稀少的语言...

python语音识别库kaldi_Kaldi 语音识别基础教程

weixin_39988197的博客

12-03

1772

Kaldi 介绍Kaldi 是由 C++ 编写的语音识别工具，其目的在于为语音识别研究者提供一个研究和使用的平台。Kaldi 环境搭建本文主要通过使用 Docker 和 Nvidia-docker 构建 Ubuntu 环境对 Kaldi 进行搭建。Docker 针对的是无 GPU 的环境，Nvidia-docker 针对的是需要使用 GPU 计算的环境，如果读者机器上存在 GPU 计算资源，请使用...

语音唤醒 语音识别

06-23

增加了讯飞未开放的语音唤醒功能，能够拨打电话，发送短信，定位，通过友盟分享

Python训练自己的语音识别系统

water的博客

10-10

5219

Python训练自己的语音识别系统引言：近几年来语音识别技术得到了迅速发展，从手机中的Siri语音智能助手、微软的小娜以及各种平台的智能音箱等等，各种语音识别的项目得到了广泛应用。语音识别属于感知智能，而让机器从简单的识别语音到理解语音，则上升到了认知智能层面，机器的自然语言理解能力如何，也成为了其是否有智慧的标志，而自然语言理解正是目前难点。同时考虑到目前大多数的语音识别平台都是借助于智能云，对于语音识别的训练对于大多数人而言还较为神秘，故今天我们将利用python搭建自己的语音识别系统。最终模型的

TensorFlow发布语音识别入门教程，附1GB数据集&代码

q6q6q的专栏

10-27

945

原标题：TensorFlow发布语音识别入门教程，附1GB数据集&代码机械鸡的鸡友经常问：如何开始入门深度学习语音和其他音频识别，例如关键字检测或语音命令。虽然有一些伟大的开源语音识别系统，如Kaldi可以使用神经网络作为一个组件，但它们的复杂性，使得它们难以被用来作简单任务的指南。目前，找不到免费且公开的数据集及教程，让初学者入门（许多需要在神经网络模型可以构建之前进行预处理），或者非常适合简单...

论文推介：CaTT-KWS—基于级联Transducer-Transformer的多阶段自定义关键词识别框架

weixin_48827824的博客

07-20

1072

关键词识别（Keyword Spotting，KWS）旨在从连续的音频流中检测特定的关键词，被广泛应用于各种端侧设备中作为语音交互的入口组件，例如智能家居的设备唤醒（WuW）和设备操控(Comand&Control)，智能座舱的人车语音交互。由于通常部署平台的计算资源有限，KWS技术要求较小的模型尺寸与较低的计算量。另外，模型的推理速度还需要满足实际应用中对于触发时延的要求。自定义关键词识别（Customized Keyword Spotting）可以允许用户自己定义检测的关键词，且无需重新训练模型，可以快

kaldi-关键词识别kws

qq_44944990的博客

04-22

1645

kaldi-关键词识别kws

Keyword Spotting (KWS) | Deep Spoken Keyword Spotting: An Overview

weixin_44935658的博客

10-10

1327

KWS

kWS

坚持,淡定

08-30

780

kWS is a lightweight and fast Web Server especially designed for android mobile devices. It can be used to host websites and to serve files over HTTP. https://play.google.com/store/apps/detai...

人工智能语音训练数据的制作方式？

AI 数据库me

03-19

3147

语音数据指标解读一、语音数据类型按照话语的自然程度分类：朗读式语音对话式语音按照信号频宽角度分类手机信道语音电话信道语音桌面语音（高保真麦克风或阵列）按照应用角度分类基础识别数据基础语音识别能力的训练数据可分为：朗读语音、自然对话、引导语音、噪音环境、情感语音、声纹识别等六大类语音数据。智能家居数据 3000小时中国儿童语音数据 797人低幼儿童中文语音数据...

KWS 自定义唤醒词语音唤醒功能实现

weixin_42357472的博客

03-01

1591

安装： 1、自定义唤醒词参考：https://k2-fsa.github.io/sherpa/onnx/kws/pretrained_models/index.html 需要先编辑keywords_raw.txt文件，里面按规则自定义：然后运行命令，生成keywords.txt 文件：运行： keywords-file=keywords.txt 即为上面生成的keywords.txt文件后续功能可以基于这里后续实现：