自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 awk grep sed 语音识别 应用 ----aishell 处理transcipt为合适的格式 和 利用DaCiDian来分词

对aishell_transcript_v0.8.txt进行处理(去掉文本之间的空格,并且修改wav名称和文本之间的隔断为tap)awk '{for(i=2;i<=NF;++i) printf $i; print "\n"}' aishell_transcript_v0.8.txt > ~/home/aishell/data/text取wav编号,为合成text分词做准备awk '{print $1}' aishell_transcript_v0.8.txt > ~/home/

2021-03-22 21:43:50 277

原创 aishell3数据处理&训练(用于ASR)- 基于content.txt的text的准备

处理之前的文本如下图:1、去除content.txt前面的 wav 名字awk '{for(i=2;i<=NF;++i) printf $i " ";printf "\n"}' content.txt > trans.txt2、去除trans.txt中的拼音和声调去除声调数字sed 's/[0-9]//g' trans.txt > no-num.txt去除字母sed 's/[A-Za-z]//g' no-num.txt > no-letter.txt去除多余的

2021-03-20 15:10:37 843

原创 语音和音乐信号中的预加重处理

功率谱和频率的关系语音和音乐信号中,信号的功率谱是随着频率的增加而减小的。也就是说:功率谱大小和频率高低是成反比的,频率越高,功率谱越低,反之亦然。为什么要在语音信号提取特征之前进行预加重首先看一下下图,下图是一段3.5秒的wav片段的频谱图,很显然,高频信号频率比较大,而低频信号频率比较小。大部分能量集中在低频范围内。这就造成消息信号高频端的信噪比可能降到不能容许的程度。但是由于消息信号中较高频率分量的能量小,很少有足以产生最大频偏的幅度,因此产生最大频偏的信号幅度多数...

2020-07-09 18:21:34 1591 1

原创 keras.models.Sequential()是一种什么模型

keras.models.Sequential()是一种什么模型:参考文章直达链接

2020-07-01 11:22:50 1983

原创 如何理解短时傅里叶变换(Short Time Fourier Transform, STFT)

因为最近一直在学习语音信号的处理,看了Haytham Fayek的一篇博客后关于什么是傅里叶变换感到很迷惑,所以就专门写下一篇文章,整理一下我从网页上搜集的内容。短时傅里叶变换(Short Time Fourier Transform, STFT) 是一个用于语音信号处理的通用工具.它定义了一个非常有用的时间和频率分布类, 其指定了任意信号随时间和频率变化的复数幅度. 实际上,计算短时傅里叶变换的过程是把一个较长的时间信号分成相同长度的更短的段, 在每个更短的段上计算傅里叶变换, 即傅里叶频谱。实现

2020-06-28 18:08:56 8227

原创 语音信号处理之语音特征提取(1)机器学习的语音处理

语音信号处理语音特征提取机器学习的语音处理

2020-06-23 15:58:20 4340 1

原创 Thymeleaf模板的学习一【基础知识】【java进阶编程】

Thymeleaf 模板引擎1、Thymeleaf 是 Web 和独立环境的现代服务器端 Java 模板引擎,能够处理HTML,XML,JavaScript,CSS 甚至纯文本。2、Thymeleaf 的主要目标是提供一种优雅和高度可维护的创建模板的方式。为了实现这一点,它建立在自然模板的概念上,将其逻辑注入到模板文件中,不会影响模板被用作设计原型。这改善了设计的沟通,弥补了设计和开发团队之间...

2019-05-13 13:17:21 254

原创 Java语言操控MySQL数据库时的sql文件

分享给大家一下,我的一个单机题库管理系统的sql文件/*Navicat MySQL Data TransferSource Server : mysqlSource Server Version : 50621Source Host : localhost:3306Source Database : studentmanageTar...

2019-04-29 17:31:31 159

Supervised speech separation based on deep learning: An overview

语音分离 人工智能 文献综述 本文提供了全面的 基于深度学习的研究概述 最近几年监督语音分离。我们 首先介绍语音分离的背景和 监督分离的制定。然后我们讨论 监督分离的三个主要组成部分:学习 机器,训练目标和声学特征。大部分 概述是关于分离算法的,我们将对其进行回顾 单声道方法,包括语音增强 (语音-非语音分离),说话者分离(多通话者分离)和语音混响以及 多麦克风技术。重要问题 讨论了监督学习所特有的泛化。

2020-07-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除