mozun2020
玄铁时代
展开
-
研究生语音识别课程作业记录(二) 非特定人孤立词识别
研究生语音识别课程作业记录(二) 非特定人孤立词识别前言一. 任务要求二. 识别方法三. 语音数据库四. 特征参数提取五. 识别过程及分析六. 小结前言研究生期间的语音识别课程作业记录,研一暑假的主要工作,也是自己正式入门语音识别的启程之路,虽然是采用传统方法进行语音识别的工程仿真,但对于一个新手菜鸟来说,这样的训练必不可少,借此机会记录一下,希望可以对刚入门语音识别的小白提供一点开拓的思路。一. 任务要求提供声音文件: 0-9的数字孤立词读音文件库,共28人录音样本,每人10次, 手工分割存原创 2022-05-01 01:34:18 · 1059 阅读 · 0 评论 -
研究生语音识别课程作业记录(一) 非特定人孤立词识别
研究生语音识别课程作业记录(一) 非特定人孤立词识别前言一. 任务要求二. 识别方法三. 语音数据库:四. 特征参数提取:五. 识别过程及分析:六. 小结前言研究生期间的语音识别课程作业记录,研一暑假的主要工作,也是自己正式入门语音识别的启程之路,虽然是采用传统方法进行语音识别的工程仿真,但对于一个新手菜鸟来说,这样的训练必不可少,借此机会记录一下,希望可以对刚入门语音识别的小白提供一点开拓的思路。一. 任务要求提供声音文件: 0-9的数字孤立词读音文件库,共28人录音样本,每人10次, 手工原创 2022-05-01 01:22:31 · 2290 阅读 · 4 评论 -
研究生语音识别课程作业记录(三) 非特定人孤立词识别
研究生语音识别课程作业记录(三) 非特定人孤立词识别前言一. 任务要求二. 识别方法三. 语音数据库四. 特征参数提取五. 识别过程及分析六. 实验总结七. 小结前言研究生期间的语音识别课程作业记录,研一暑假的主要工作,也是自己正式入门语音识别的启程之路,虽然是采用传统方法进行语音识别的工程仿真,但对于一个新手菜鸟来说,这样的训练必不可少,借此机会记录一下,希望可以对刚入门语音识别的小白提供一点开拓的思路。一. 任务要求提供声音文件: 0-9的数字孤立词读音文件库,共28人录音样本,每人10次原创 2022-05-02 00:45:00 · 1833 阅读 · 2 评论 -
保姆级win7下配置虚拟机-安装Ubuntu20.04
win7下配置虚拟机-安装Ubuntu20.4一. 虚拟机安装1.1虚拟机准备1.2虚拟机安装二. Ubuntu安装2.1Ubuntu创建安装2.2Ubuntu直接安装三. 小结一. 虚拟机安装深度学习以及神经网络等相关项目大都需要在Linux系统下进行配置安装,因此,在win7系统下配置一个虚拟机,安装一个Ubuntu系统,便于进行后期的图像处理与语音识别相关项目的基础。1.1虚拟机准备虚拟机下载地址:1.2虚拟机安装双击安装vmware workstation 12 密原创 2022-04-08 00:14:40 · 3512 阅读 · 0 评论 -
MATLAB语音信号处理(1)播放音视频
MATLAB语音信号处理(1)播放音视频前言一. MATLAB仿真二. 仿真结果三. 小结前言MATLAB进行图像处理相关的学习是非常友好的,可以从零开始,对基础的图像处理都已经有了封装好的许多可直接调用的函数,这个系列文章的话主要就是介绍一些大家在MATLAB中常用一些概念函数进行例程演示!其实MATLAB不仅可以处理图像数据,对于语音信号的仿真处理也得到许多应用,自己在研究生期间的语音信号处理课程基本上是通过MATLAB进行仿真实验的,最近正好有好些语音相关的同学咨询与请教,这里就介绍一下如何通过原创 2022-05-28 00:10:51 · 1999 阅读 · 1 评论 -
VS语音信号处理(7) C语言调用SoundTouch进行变速不变调工程集成调试
VS语音信号处理(7) C语言调用SoundTouch进行变速不变调工程集成调试前言一. 源码下载即链接库准备二. 工程编译准备三. 例程实现四. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。今天介绍SoundTouch语音变速不变调算法的工程应用。SoundTouch是一个支持音频倍速播放的开源库。支持变速(加速减速)、变调、变速同时变调等三类功能模块,原创 2022-06-07 23:54:18 · 897 阅读 · 0 评论 -
VS语音信号处理(6) C语言调用SoundTouch进行变速不变调工程实例
VS语音信号处理(6) C语言调用SoundTouch进行变速不变调工程实例前言一. 源码下载即链接库准备二. 工程编译准备三. 例程实现四. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。今天介绍SoundTouch语音变速不变调算法的工程应用。SoundTouch是一个支持音频倍速播放的开源库。支持加速减速的播放。有ANSI C的版本,也有纯Java的版原创 2022-05-26 00:20:42 · 1111 阅读 · 0 评论 -
VS语音信号处理(5) C语言PCM格式语音存为WAV格式语音工程实例
VS语音信号处理(5) C语言PCM格式语音存为WAV格式语音工程实例前言一. 工程实现二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。今天介绍PCM格式语音存为WAV格式语音的工程应用。两种格式语音的唯一区别在于WAV语音包含文件头信息,而PCM格式语音仅包含语音数据流。语音格式转换也算是一种比较常见的应用,可以让我们更好的理解语音文件的原创 2022-05-11 00:16:33 · 935 阅读 · 0 评论 -
VS语音信号处理(4) C语言WAV格式语音存为PCM格式语音工程实例
VS语音信号处理(4) C语言WAV格式语音存为PCM格式语音工程实例前言一. 工程实现二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。今天介绍WAV格式语音存为PCM格式语音的工程应用。两种格式语音的唯一区别在于WAV语音包含文件头信息,而PCM格式语音仅包含语音数据流。语音格式转换也算是一种比较常见的应用,可以让我们更好的理解语音文件的原创 2022-05-10 00:11:55 · 1172 阅读 · 1 评论 -
VS语音信号处理(3) sonic变速不变调调试记录(二)
VS语音信号处理(3)sonic变速不变调调试记录(二)前言一. main函数二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。今天介绍sonic语音变速不变调算法的工程应用。libsonic是一个支持音频倍速播放的开源库。支持大于2倍速的播放。有ANSI C的版本,也有纯Java的版本。无外部依赖能够方便的集成进自己的应用中。具体工程以及原创 2022-05-16 23:14:30 · 604 阅读 · 0 评论 -
VS语音信号处理(3) sonic变速不变调调试记录(一)
VS语音信号处理(3)sonic变速不变调调试记录一前言一. main函数二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。今天介绍sonic语音变速不变调算法的工程应用。libsonic是一个支持音频倍速播放的开源库。支持大于2倍速的播放。有ANSI C的版本,也有纯Java的版本。无外部依赖能够方便的集成进自己的应用中。具体工程以及so原创 2022-05-14 23:50:43 · 944 阅读 · 0 评论 -
VS语音信号处理(3) C语言调用sonic进行变速不变调工程实例
VS语音信号处理(3) C语言调用sonic进行变速不变调工程实例前言一. 工程实现二. 生成编译三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。今天介绍sonic语音变速不变调算法的工程应用。libsonic是一个支持音频倍速播放的开源库。支持大于2倍速的播放。有ANSI C的版本,也有纯Java的版本。无外部依赖能够方便的集成进自己的应用中。一.原创 2022-05-07 22:34:51 · 1102 阅读 · 0 评论 -
VS语音信号处理(2) C语言分段读取WAV语音文件语音数据
VS语音信号处理(2) C语言分段读取WAV语音文件语音数据前言一. 工程实现二. 结果三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。语音文件的格式多种多样都存在不同的标准,在WAV格式的语音文件中主要包含两个部分:文件头与语音数据,本文将介绍读取WAV语音文件的文件头数据。WAV格式语音文件数据标准如下图所示。即前44位位文件头数据,44位之后为原创 2022-04-28 05:00:00 · 1511 阅读 · 0 评论 -
VS语音信号处理(1) C语言读取WAV语音文件文件头数据
VS语音信号处理(1) C语言读取WAV语音文件文件头数据前言一. 工程实现二. 结果三. 小结前言语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。语音文件的格式多种多样都存在不同的标准,在WAV格式的语音文件中主要包含两个部分:文件头与语音数据,本文将介绍读取WAV语音文件的文件头数据。WAV格式语音文件数据标准如下图所示。即前44位位文件头数据,44位之后为语原创 2022-04-27 23:17:11 · 3459 阅读 · 0 评论 -
保姆级kaldi语音识别(2)Linux系统Ubuntu20.04下开源语音识别工具kaldi配置
Linux系统Ubuntu20.4下kaldi配置前言一. kaldi准备1.1虚拟机准备1.2虚拟机安装二. kaldi配置库安装三. kaldi例程实验四. 小结前言深度学习以及神经网络等相关项目大都需要在Linux系统下进行配置安装,作为一名算法工程师,特别是在图像处理与语音识别领域进行深入研究,深度学习各类相关的模型是自己进行接下来学习研究的一个基础。考虑到安装双系统的费时费力,切换不便,因此,就准备着手在win7系统下搭建一个虚拟机,安装一个Ubuntu系统,准备进行一些模型的配置搭建,跑一原创 2022-04-13 23:58:55 · 5273 阅读 · 2 评论