自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 《噪声环境下的语音关键词检索》阅读笔记

《噪声环境下的语音关键词检索》阅读笔记摘要:为了实现免手持语音识别的体验,语音识别系统需要持续不断地监听特定唤醒词语来开启语音识别任务,这个过程通常被定义为关键词检索(KDW)或者关键词识别(KWS)。在现实生活中,噪声干扰不可避免,噪声鲁棒性对关键词识别任务至关重要,因此我们为提高关键词的鲁棒性做了三方面的尝试。首先,将语音增强系统和关键词检测系统连接起来构成更复杂的系统,整个系统采用联合训练的方法。第二,提出了一种新的卷积循环神经网络。最后,为了进一步提升系统的性能,设计了特征转换模块。本文采用基于联

2020-11-14 14:52:28 1019

原创 第二章、神经网络的构建模块

第二章、神经网络的构建模块本章首先介绍了pytorch的安装,我是在linux服务器下的anaconda的环境下安装的,今天主要介绍第一个·神经网络示例,后续有机会我会把安装的具体操作写下来的。文章展示了我们的第一个神经网络,它学习如何映射训练例子(输入数组)到目标(输出数组)。这个示例假想:训练数据是用户在平台上看电影的平均时间,我们要预测在接下来的一周用户花费多少时间在平台上看电影。构建这样一个方案需要做如下事情:数据准备:get_data函数准备包含输入和输出数据的张量(数组)。数据准备阶段介

2020-10-16 20:02:36 187

原创 《deep learning with pytorch》学习笔记,欢迎批评指正

《deep learning with pytorch》学习笔记,欢迎批评指正第一章:使用PyTorch进行深度学习入门近些年来,有关人工智能的话题越来越火热。那么什么是人工智能,人工智能是如何定义的,在本书中谈到通常由人类完成的智能任务的自动化即为人工智能。对于早期的人工智能来说,机器能做一下我们人类很难做到的事情,例如恩尼格码密码机,我们去破解密码可能需要几周的时间,但对于机器来说也就几个小时。虽然机器能解决对于人类比较艰难的问题,但是他不能做像区分猫狗,判断朋友是否生气这样的事情,而且它很难被编码

2020-10-15 11:39:36 184

原创 今日心情小记

今日心情小记迈入研究生的大门已一月左右,未开学之前曾信心满满,想用尽自己的全部力气去学习。身边的朋友说,研一的生活没有那么紧张,你可以做一些自己感兴趣的事情丰富自己的生活,拓宽知识面。然而当我入住宿舍的第一天开始,就被舍友的爱学习所惊叹,我开始慌张,不知如何去学习,又在想自己本就基础差,又该怎么学习。我本不是个爱说话的人,又比较羞涩,在每次见导师时都表现得很差,我又会想怎么办呀,给老师留下了不好的印象。这不是最重要的,最重要的是我还什么都不会。连续犯了老毛病一个月,每天折磨的有些疲倦,这么长时间以来自

2020-10-13 20:09:37 209

原创 语音信号处理过程以及一些基本概念

语音信号处理过程以及一些基本概念语音分离的过程:首先输入数据,此时数据包括speech目标语音,noise 噪声以及混合语音(带噪语音),经过时频分解-目标计算、特征抽取等一系列操作进入到模型训练,最后分离模型。基本知识:1、基于深度学习的语音增强方法主要包括mask和mapping。mask:译为掩膜、掩码,是深度学习中的常见操作。简单来说,其相当于在原始输入数据(张量)盖上一层掩膜,从而屏蔽或选择一些特定元素,因此常用于构建张量的过滤器。1)、基于mask的方法又可以分为“理想二值掩蔽”(Id

2020-10-12 20:33:03 2504

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除