林深迷了鹿-CSDN博客

原创 awk grep sed 语音识别应用 ----aishell 处理transcipt为合适的格式和利用DaCiDian来分词

对aishell_transcript_v0.8.txt进行处理（去掉文本之间的空格，并且修改wav名称和文本之间的隔断为tap）awk '{for(i=2;i<=NF;++i) printf $i; print "\n"}' aishell_transcript_v0.8.txt > ~/home/aishell/data/text取wav编号，为合成text分词做准备awk '{print $1}' aishell_transcript_v0.8.txt > ~/home/

2021-03-22 21:43:50 277

原创 aishell3数据处理&训练（用于ASR）- 基于content.txt的text的准备

处理之前的文本如下图：1、去除content.txt前面的 wav 名字awk '{for(i=2;i<=NF;++i) printf $i " ";printf "\n"}' content.txt > trans.txt2、去除trans.txt中的拼音和声调去除声调数字sed 's/[0-9]//g' trans.txt > no-num.txt去除字母sed 's/[A-Za-z]//g' no-num.txt > no-letter.txt去除多余的

2021-03-20 15:10:37 843

原创语音和音乐信号中的预加重处理

功率谱和频率的关系语音和音乐信号中，信号的功率谱是随着频率的增加而减小的。也就是说：功率谱大小和频率高低是成反比的，频率越高，功率谱越低，反之亦然。为什么要在语音信号提取特征之前进行预加重首先看一下下图，下图是一段3.5秒的wav片段的频谱图，很显然，高频信号频率比较大，而低频信号频率比较小。大部分能量集中在低频范围内。这就造成消息信号高频端的信噪比可能降到不能容许的程度。但是由于消息信号中较高频率分量的能量小，很少有足以产生最大频偏的幅度，因此产生最大频偏的信号幅度多数...

2020-07-09 18:21:34 1591 1

原创 keras.models.Sequential()是一种什么模型

keras.models.Sequential()是一种什么模型：参考文章直达链接

2020-07-01 11:22:50 1983

原创如何理解短时傅里叶变换(Short Time Fourier Transform, STFT)

因为最近一直在学习语音信号的处理，看了Haytham Fayek的一篇博客后关于什么是傅里叶变换感到很迷惑，所以就专门写下一篇文章，整理一下我从网页上搜集的内容。短时傅里叶变换(Short Time Fourier Transform, STFT) 是一个用于语音信号处理的通用工具.它定义了一个非常有用的时间和频率分布类, 其指定了任意信号随时间和频率变化的复数幅度. 实际上,计算短时傅里叶变换的过程是把一个较长的时间信号分成相同长度的更短的段, 在每个更短的段上计算傅里叶变换, 即傅里叶频谱。实现

2020-06-28 18:08:56 8227

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

notlikeregist的博客

原创 awk grep sed 语音识别应用 ----aishell 处理transcipt为合适的格式和利用DaCiDian来分词

原创 aishell3数据处理&训练（用于ASR）- 基于content.txt的text的准备

原创语音和音乐信号中的预加重处理

原创 keras.models.Sequential()是一种什么模型

原创如何理解短时傅里叶变换(Short Time Fourier Transform, STFT)

原创语音信号处理之语音特征提取（1）机器学习的语音处理

原创 Thymeleaf模板的学习一【基础知识】【java进阶编程】

原创 Java语言操控MySQL数据库时的sql文件

Supervised speech separation based on deep learning: An overview

空空如也