- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 awk grep sed 语音识别 应用 ----aishell 处理transcipt为合适的格式 和 利用DaCiDian来分词
对aishell_transcript_v0.8.txt进行处理(去掉文本之间的空格,并且修改wav名称和文本之间的隔断为tap)awk '{for(i=2;i<=NF;++i) printf $i; print "\n"}' aishell_transcript_v0.8.txt > ~/home/aishell/data/text取wav编号,为合成text分词做准备awk '{print $1}' aishell_transcript_v0.8.txt > ~/home/
2021-03-22 21:43:50
277
原创 aishell3数据处理&训练(用于ASR)- 基于content.txt的text的准备
处理之前的文本如下图:1、去除content.txt前面的 wav 名字awk '{for(i=2;i<=NF;++i) printf $i " ";printf "\n"}' content.txt > trans.txt2、去除trans.txt中的拼音和声调去除声调数字sed 's/[0-9]//g' trans.txt > no-num.txt去除字母sed 's/[A-Za-z]//g' no-num.txt > no-letter.txt去除多余的
2021-03-20 15:10:37
843
原创 语音和音乐信号中的预加重处理
功率谱和频率的关系语音和音乐信号中,信号的功率谱是随着频率的增加而减小的。也就是说:功率谱大小和频率高低是成反比的,频率越高,功率谱越低,反之亦然。为什么要在语音信号提取特征之前进行预加重首先看一下下图,下图是一段3.5秒的wav片段的频谱图,很显然,高频信号频率比较大,而低频信号频率比较小。大部分能量集中在低频范围内。这就造成消息信号高频端的信噪比可能降到不能容许的程度。但是由于消息信号中较高频率分量的能量小,很少有足以产生最大频偏的幅度,因此产生最大频偏的信号幅度多数...
2020-07-09 18:21:34
1591
1
原创 keras.models.Sequential()是一种什么模型
keras.models.Sequential()是一种什么模型:参考文章直达链接
2020-07-01 11:22:50
1983
原创 如何理解短时傅里叶变换(Short Time Fourier Transform, STFT)
因为最近一直在学习语音信号的处理,看了Haytham Fayek的一篇博客后关于什么是傅里叶变换感到很迷惑,所以就专门写下一篇文章,整理一下我从网页上搜集的内容。短时傅里叶变换(Short Time Fourier Transform, STFT) 是一个用于语音信号处理的通用工具.它定义了一个非常有用的时间和频率分布类, 其指定了任意信号随时间和频率变化的复数幅度. 实际上,计算短时傅里叶变换的过程是把一个较长的时间信号分成相同长度的更短的段, 在每个更短的段上计算傅里叶变换, 即傅里叶频谱。实现
2020-06-28 18:08:56
8227
原创 Thymeleaf模板的学习一【基础知识】【java进阶编程】
Thymeleaf 模板引擎1、Thymeleaf 是 Web 和独立环境的现代服务器端 Java 模板引擎,能够处理HTML,XML,JavaScript,CSS 甚至纯文本。2、Thymeleaf 的主要目标是提供一种优雅和高度可维护的创建模板的方式。为了实现这一点,它建立在自然模板的概念上,将其逻辑注入到模板文件中,不会影响模板被用作设计原型。这改善了设计的沟通,弥补了设计和开发团队之间...
2019-05-13 13:17:21
254
原创 Java语言操控MySQL数据库时的sql文件
分享给大家一下,我的一个单机题库管理系统的sql文件/*Navicat MySQL Data TransferSource Server : mysqlSource Server Version : 50621Source Host : localhost:3306Source Database : studentmanageTar...
2019-04-29 17:31:31
159
Supervised speech separation based on deep learning: An overview
2020-07-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人