VP1:语音信号处理_mozun2020的博客-CSDN博客

VP1:语音信号处理

文章平均质量分 84

实际过程项目中遇到的语音信号处理的环境配置，算法落地应用等遇到的问题分析与对应解决方案的分享记录

文章数：15 文章阅读量：27698 文章收藏量：173

作者: mozun2020

玄铁时代

展开

研究生语音识别课程作业记录（二）非特定人孤立词识别

研究生语音识别课程作业记录（二）非特定人孤立词识别前言一. 任务要求二. 识别方法三. 语音数据库四. 特征参数提取五. 识别过程及分析六. 小结前言研究生期间的语音识别课程作业记录，研一暑假的主要工作，也是自己正式入门语音识别的启程之路，虽然是采用传统方法进行语音识别的工程仿真，但对于一个新手菜鸟来说，这样的训练必不可少，借此机会记录一下，希望可以对刚入门语音识别的小白提供一点开拓的思路。一. 任务要求提供声音文件: 0－9的数字孤立词读音文件库，共28人录音样本，每人10次，手工分割存

原创 2022-05-01 01:34:18 · 1059 阅读 · 0 评论
研究生语音识别课程作业记录（一）非特定人孤立词识别

研究生语音识别课程作业记录（一）非特定人孤立词识别前言一. 任务要求二. 识别方法三. 语音数据库：四. 特征参数提取：五. 识别过程及分析：六. 小结前言研究生期间的语音识别课程作业记录，研一暑假的主要工作，也是自己正式入门语音识别的启程之路，虽然是采用传统方法进行语音识别的工程仿真，但对于一个新手菜鸟来说，这样的训练必不可少，借此机会记录一下，希望可以对刚入门语音识别的小白提供一点开拓的思路。一. 任务要求提供声音文件: 0－9的数字孤立词读音文件库，共28人录音样本，每人10次，手工

原创 2022-05-01 01:22:31 · 2290 阅读 · 4 评论
研究生语音识别课程作业记录（三）非特定人孤立词识别

研究生语音识别课程作业记录（三）非特定人孤立词识别前言一. 任务要求二. 识别方法三. 语音数据库四. 特征参数提取五. 识别过程及分析六. 实验总结七. 小结前言研究生期间的语音识别课程作业记录，研一暑假的主要工作，也是自己正式入门语音识别的启程之路，虽然是采用传统方法进行语音识别的工程仿真，但对于一个新手菜鸟来说，这样的训练必不可少，借此机会记录一下，希望可以对刚入门语音识别的小白提供一点开拓的思路。一. 任务要求提供声音文件: 0－9的数字孤立词读音文件库，共28人录音样本，每人10次

原创 2022-05-02 00:45:00 · 1833 阅读 · 2 评论
保姆级win7下配置虚拟机-安装Ubuntu20.04

win7下配置虚拟机-安装Ubuntu20.4一. 虚拟机安装1.1虚拟机准备1.2虚拟机安装二. Ubuntu安装2.1Ubuntu创建安装2.2Ubuntu直接安装三. 小结一. 虚拟机安装深度学习以及神经网络等相关项目大都需要在Linux系统下进行配置安装，因此，在win7系统下配置一个虚拟机，安装一个Ubuntu系统，便于进行后期的图像处理与语音识别相关项目的基础。1.1虚拟机准备虚拟机下载地址：1.2虚拟机安装双击安装vmware workstation 12 密

原创 2022-04-08 00:14:40 · 3512 阅读 · 0 评论
MATLAB语音信号处理（1）播放音视频

MATLAB语音信号处理（1）播放音视频前言一. MATLAB仿真二. 仿真结果三. 小结前言MATLAB进行图像处理相关的学习是非常友好的，可以从零开始，对基础的图像处理都已经有了封装好的许多可直接调用的函数，这个系列文章的话主要就是介绍一些大家在MATLAB中常用一些概念函数进行例程演示！其实MATLAB不仅可以处理图像数据，对于语音信号的仿真处理也得到许多应用，自己在研究生期间的语音信号处理课程基本上是通过MATLAB进行仿真实验的，最近正好有好些语音相关的同学咨询与请教，这里就介绍一下如何通过

原创 2022-05-28 00:10:51 · 1999 阅读 · 1 评论
VS语音信号处理（7） C语言调用SoundTouch进行变速不变调工程集成调试

VS语音信号处理（7） C语言调用SoundTouch进行变速不变调工程集成调试前言一. 源码下载即链接库准备二. 工程编译准备三. 例程实现四. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。今天介绍SoundTouch语音变速不变调算法的工程应用。SoundTouch是一个支持音频倍速播放的开源库。支持变速（加速减速）、变调、变速同时变调等三类功能模块，

原创 2022-06-07 23:54:18 · 897 阅读 · 0 评论
VS语音信号处理（6） C语言调用SoundTouch进行变速不变调工程实例

VS语音信号处理（6） C语言调用SoundTouch进行变速不变调工程实例前言一. 源码下载即链接库准备二. 工程编译准备三. 例程实现四. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。今天介绍SoundTouch语音变速不变调算法的工程应用。SoundTouch是一个支持音频倍速播放的开源库。支持加速减速的播放。有ANSI C的版本，也有纯Java的版

原创 2022-05-26 00:20:42 · 1111 阅读 · 0 评论
VS语音信号处理（5） C语言PCM格式语音存为WAV格式语音工程实例

VS语音信号处理（5） C语言PCM格式语音存为WAV格式语音工程实例前言一. 工程实现二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。今天介绍PCM格式语音存为WAV格式语音的工程应用。两种格式语音的唯一区别在于WAV语音包含文件头信息，而PCM格式语音仅包含语音数据流。语音格式转换也算是一种比较常见的应用，可以让我们更好的理解语音文件的

原创 2022-05-11 00:16:33 · 935 阅读 · 0 评论
VS语音信号处理（4） C语言WAV格式语音存为PCM格式语音工程实例

VS语音信号处理（4） C语言WAV格式语音存为PCM格式语音工程实例前言一. 工程实现二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。今天介绍WAV格式语音存为PCM格式语音的工程应用。两种格式语音的唯一区别在于WAV语音包含文件头信息，而PCM格式语音仅包含语音数据流。语音格式转换也算是一种比较常见的应用，可以让我们更好的理解语音文件的

原创 2022-05-10 00:11:55 · 1172 阅读 · 1 评论
VS语音信号处理（3） sonic变速不变调调试记录（二）

VS语音信号处理（3）sonic变速不变调调试记录（二）前言一. main函数二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。今天介绍sonic语音变速不变调算法的工程应用。libsonic是一个支持音频倍速播放的开源库。支持大于2倍速的播放。有ANSI C的版本，也有纯Java的版本。无外部依赖能够方便的集成进自己的应用中。具体工程以及

原创 2022-05-16 23:14:30 · 604 阅读 · 0 评论
VS语音信号处理（3） sonic变速不变调调试记录（一）

VS语音信号处理（3）sonic变速不变调调试记录一前言一. main函数二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。今天介绍sonic语音变速不变调算法的工程应用。libsonic是一个支持音频倍速播放的开源库。支持大于2倍速的播放。有ANSI C的版本，也有纯Java的版本。无外部依赖能够方便的集成进自己的应用中。具体工程以及so

原创 2022-05-14 23:50:43 · 944 阅读 · 0 评论
VS语音信号处理（3） C语言调用sonic进行变速不变调工程实例

VS语音信号处理（3） C语言调用sonic进行变速不变调工程实例前言一. 工程实现二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。今天介绍sonic语音变速不变调算法的工程应用。libsonic是一个支持音频倍速播放的开源库。支持大于2倍速的播放。有ANSI C的版本，也有纯Java的版本。无外部依赖能够方便的集成进自己的应用中。一.

原创 2022-05-07 22:34:51 · 1102 阅读 · 0 评论
VS语音信号处理（2） C语言分段读取WAV语音文件语音数据

VS语音信号处理（2） C语言分段读取WAV语音文件语音数据前言一. 工程实现二. 结果三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。语音文件的格式多种多样都存在不同的标准，在WAV格式的语音文件中主要包含两个部分：文件头与语音数据，本文将介绍读取WAV语音文件的文件头数据。WAV格式语音文件数据标准如下图所示。即前44位位文件头数据，44位之后为

原创 2022-04-28 05:00:00 · 1511 阅读 · 0 评论
VS语音信号处理（1） C语言读取WAV语音文件文件头数据

VS语音信号处理（1） C语言读取WAV语音文件文件头数据前言一. 工程实现二. 结果三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验，在工程上一般还是在VS中进行实现落地，本系列将介绍语音信号处理在C语言中的一系列应用，后期将以此为基础，再落地移植到嵌入式平台。语音文件的格式多种多样都存在不同的标准，在WAV格式的语音文件中主要包含两个部分：文件头与语音数据，本文将介绍读取WAV语音文件的文件头数据。WAV格式语音文件数据标准如下图所示。即前44位位文件头数据，44位之后为语

原创 2022-04-27 23:17:11 · 3459 阅读 · 0 评论
保姆级kaldi语音识别（2）Linux系统Ubuntu20.04下开源语音识别工具kaldi配置

Linux系统Ubuntu20.4下kaldi配置前言一. kaldi准备1.1虚拟机准备1.2虚拟机安装二. kaldi配置库安装三. kaldi例程实验四. 小结前言深度学习以及神经网络等相关项目大都需要在Linux系统下进行配置安装，作为一名算法工程师，特别是在图像处理与语音识别领域进行深入研究，深度学习各类相关的模型是自己进行接下来学习研究的一个基础。考虑到安装双系统的费时费力，切换不便，因此，就准备着手在win7系统下搭建一个虚拟机，安装一个Ubuntu系统，准备进行一些模型的配置搭建，跑一

原创 2022-04-13 23:58:55 · 5273 阅读 · 2 评论

VP1:语音信号处理

作者: mozun2020

研究生语音识别课程作业记录（二） 非特定人孤立词识别

研究生语音识别课程作业记录（一） 非特定人孤立词识别

研究生语音识别课程作业记录（三） 非特定人孤立词识别

保姆级win7下配置虚拟机-安装Ubuntu20.04

MATLAB语音信号处理（1）播放音视频

VS语音信号处理（7） C语言调用SoundTouch进行变速不变调工程集成调试

VS语音信号处理（6） C语言调用SoundTouch进行变速不变调工程实例

VS语音信号处理（5） C语言PCM格式语音存为WAV格式语音工程实例

VS语音信号处理（4） C语言WAV格式语音存为PCM格式语音工程实例

VS语音信号处理（3） sonic变速不变调调试记录（二）

VS语音信号处理（3） sonic变速不变调调试记录（一）

VS语音信号处理（3） C语言调用sonic进行变速不变调工程实例

VS语音信号处理（2） C语言分段读取WAV语音文件语音数据

VS语音信号处理（1） C语言读取WAV语音文件文件头数据

保姆级kaldi语音识别（2）Linux系统Ubuntu20.04下开源语音识别工具kaldi配置

研究生语音识别课程作业记录（二）非特定人孤立词识别

研究生语音识别课程作业记录（一）非特定人孤立词识别

研究生语音识别课程作业记录（三）非特定人孤立词识别