- 博客(26)
- 资源 (8)
- 收藏
- 关注
原创 Linux shell多进程并发及管道阻塞处理
在linux平台上,shell脚本进行多进程并发处理是常见的操作,尤其是在需要并行处理大量数据的时候。然而在编码执行过程中遇到了一些问题,记录于下。1. 并发控制 网上搜索能找到一些并发控制方法,如一、linux shell多进程以及二、Linux Shell多进程并发以及并发数控制。 两篇文章的方法思路一致,仅在实现细节上有差异。其中,文章一的方法在加锁处理进程安全方面更好,文章二在背景知识.
2020-12-10 10:20:49
2134
2
原创 python读写音频文件小结
在语音处理中,音频文件读写是基本操作。然而读写方式乃至归一化处理的多样化,有可能导致后续处理的偏差乃至错误。本文汇集实践中所遇的一些方法,并参考了其他文章,确保读写操作的准确性和一致性。前置条件 本文以实践中常见的音频文件参数(wav格式,PCM编码,单通道,采样率16KHz,位深16bit)为例,如果参数不同需做对应调整。一. 文件读取1. librosa import librosa wav_path='' sample_r.
2020-12-02 15:12:00
22911
9
原创 ICASSP2020中语音合成部分论文阅读(未完待续)
ICASSP2020在5月份已经结束,拿到论文集后,慢慢花时间看一看同行的成果和进展,也算是汲取一点新鲜养分吧。简短介绍的同时也会附上自己粗浅鄙陋的想法。谬误良多,不吝指教。文章目录一. 综述二. 声学模型-稳定性1. 《Focusing on Attention: Prosody Transfer and Adaptative Optimization Strategy for Multi-Speaker End-to-End Speech Synthesis》一. 综述 &nbs.
2020-06-18 16:45:20
1986
1
原创 Tensorflow迁移学习加载预训练模型并修改变量shape和value的方法
迁移学习在深度学习中是经常被使用的方法,指的是在一个任务中预训练的模型被用于另一个任务的模型训练,以加快模型训练,减少资源消耗。然而网络搜索相关的话题,基本上只涉及加载预训练模型的特定变量值的方法,即不涉及预训练模型某个变量与当前任务网络对应变量shape改变的处理。在具体的语音合成多说话人模型迁移学习得到单说话人模型的任务中,就涉及到了迁移变量改变shape的情况,将解决方法如下列出。...
2020-02-16 21:02:56
3803
4
转载 Linux xargs命令的理解和使用
xargs是Linux中一个很常用的命令,然而之前即使用到也没能够很好地理解。这次在解决“bash: /bin/mv: Argument list too long”问题时,找到了一份很容易理解的资料。转载地址:xargs命令详解,xargs与管道的区别文章目录一. 为什么要用xargs,问题的来源二. xargs是什么,与管道有什么不同三. xargs的一些有用的选项1. -d 选项2...
2019-06-14 16:54:23
3910
1
原创 集群个人用户离线复制管理Python环境的一些问题
项目的Python环境一直没有有效管理,大家都是用的同一个环境。某个包需要特定的版本,必然需要考虑升级会不会影响其他人、其他程序的运行。在研究WaveGlow代码时,其依赖的torch1.0高于当前的0.4版本,故研究了一下Python环境的复制和管理问题。中间遇到了一些问题,一一解决并决心记录下来。前置条件:个人非root用户、集群共享存储、离线环境(增加了问题解决的难度)、使用了Anac...
2018-12-26 14:45:14
797
原创 tensorflow变量管理与命名空间
在训练深度网络时,为了减少需要训练参数的个数、或是多机多卡并行化训练大数据大模型等情况时,往往需要共享变量。另外一方面是当模型变得非常复杂的时候,往往存在大量的变量和操作,如何避免这些变量名和操作名的唯一不重复,同时维护一个条理清晰的graph非常重要。本文主要涉及tensorflow中变量管理和命名空间相关的函数:tf.Variable,tf.get_variable,tf.variable...
2018-11-15 19:31:54
1652
1
翻译 【论文翻译】Deep Voice 3:通过卷积序列学习来扩展语音合成
Deep Voice 3 引入了全卷积序列到序列式模型来进行语音合成,这种新架构在语音训练速度上有了数量级的提升,经过800 多个小时的语音数据学习,它可以合成 2400 多钟不同的语音结果。Deep Voice 3的意义在于探索语音合成模型训练的数据容量上限。 原论文链接: Deep Voice 3: Scaling Text-to-Speech with Convolution...
2018-09-19 10:19:44
3970
2
转载 【论文翻译】WaveNet:一种原始音频的生成模型
Google Brain团队结合Tacotron和WaveNet等研究思路,增加了更多改进,最终实现了新的端到端语音合成系统Tacotron 2,达到了接近人声的效果。 原论文链接: WaveNet: A Generative Model for Raw Audio 最近开始研究端到端语音合成。相关的论文原本准备自己翻译,看到网上已经有翻译的比较好的版本, 故转载于...
2018-08-30 18:52:56
7692
1
翻译 【论文翻译】使用少量样本的神经语音克隆
这篇论文探讨了解决语音克隆问题的两种基本方法:说话人自适应(speaker adaptation)和说话人编码(speaker encoding)。适用于带有说话人嵌入的多说话人语音生成模型,不会降低音频质量。 原论文链接: Neural Voice Cloning with a Few Samples摘要 语音克隆是个性化语音接口的一项备受期待的能力。基于神经网络的语...
2018-08-28 11:15:02
3616
转载 【论文翻译】联合学习对齐和翻译的神经机器翻译
这篇论文在采用RNN编码器-解码器结构做端到端的神经机器翻译的基础上,使得模型可以在预测下一个词的时候,自动地搜索源句子相关的部分,这就是attention机制。 原论文链接: Neural Machine Translation by Jointly Learning to Align and Translate 最近开始研究端到端语音合成,由于Attention机制在...
2018-08-09 13:48:45
2556
转载 【论文翻译】通过梅尔频谱预测来训练WaveNet的自然语音合成
Google Brain团队结合Tacotron和WaveNet等研究思路,增加了更多改进,最终实现了新的端到端语音合成系统Tacotron 2,达到了接近人声的效果。 原论文链接: Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions 最近开始研究端到端语音合成。相关的论...
2018-08-06 18:15:41
3998
转载 【论文翻译】Tacotron:端到端语音合成
Tacotron是谷歌于2017年提出的端到端语音合成系统,该模型可接收字符的输入,输出相应的原始频谱图, 然后将其提供给 Griffin-Lim 重建算法直接生成语音。 原论文链接: Tacotron: Towards End-to-End Speech Synthesis 最近开始研究端到端语音合成。相关的论文原本准备自己翻译,看到网上已经有翻译的比较好的版本,...
2018-08-04 16:16:17
5340
翻译 CUED-RNNLM:一个有效训练评估RNN语言模型的开源工具包
本文介绍了CUED-RNNLM,一个开源工具包,它能支持高效的基于GPU的RNNLMs训练。
2017-12-27 21:03:27
4930
1
翻译 Merlin:一个开源的神经网络语音合成系统
介绍Merlin语音合成工具包用于基于神经网络的语音合成。该系统将语言特征作为输入,采用神经网络来预测声学特征,然后将声学特征传递到声音合成机(vocoder)以产生语音波形。
2017-02-20 10:30:16
24850
转载 语音信号处理之(四)梅尔频率倒谱系数(MFCC)
MFCCs(Mel Frequency Cepstral Coefficents)是一种在自动语音和说话人识别中广泛使用的特征
2017-01-04 10:55:24
1228
原创 语音识别之发音字典
发音字典(lexicon)包含了从单词(words)到音素(phones)之间的映射,作用是用来连接声学模型和语言模型的。
2016-12-29 18:57:34
22246
2
原创 mysql远程访问,主从/主主双机备份,以及使用keeplived实现故障自动切换(一)
1. mysql远程访问2. 主从/主主双机备份3. keepalived故障自动切换
2016-11-22 10:56:46
633
原创 使用Scrapy递归爬取网页
1. scrapy介绍与安装 Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。(百度百科的描述) 安装过程见CentOS7下安装Scrapy,基于Python2.7.5版本。2. 项目代码与分析(1)创建项目scrapy startproject Fi
2016-11-05 17:23:47
11300
基于GSM短信模块家庭防盗报警系统
2011-04-21
基于P2P技术的网络视频会议系统研究
2011-04-21
改进的遗传算法求解TSP问题
2011-04-21
线性直流稳压电源的设计
2011-04-21
《Java2程序设计实用教程(第2版)》课件
2011-04-21
单片机入门与巩固提高(全面)
2011-04-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人