自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

转载 Windows10远程桌面Ubuntu16.04

https://blog.csdn.net/woodcorpse/article/details/80503232

2020-01-17 17:07:25

阅读数 12

评论数 0

转载 windows10内网和外网访问ubuntu服务器

https://blog.csdn.net/u011436427/article/details/89164544 https://www.2cto.com/net/201806/756272.html

2020-01-13 15:39:46

阅读数 8

评论数 0

转载 语音特征MFCC提取过程详解

https://blog.csdn.net/class_brick/article/details/82743741

2020-01-10 13:03:18

阅读数 7

评论数 0

转载 标签平滑正则化

https://blog.csdn.net/lqfarmer/article/details/74276680

2020-01-09 14:29:01

阅读数 10

评论数 0

转载 /boot空间满了

https://blog.csdn.net/fendoubasaonian/article/details/88900431

2020-01-09 09:19:25

阅读数 9

评论数 0

转载 Transformer的PyTorch实现

https://blog.csdn.net/stupid_3/article/details/83184691

2020-01-07 15:43:08

阅读数 1

评论数 0

转载 语音相关比赛

https://blog.csdn.net/yj13811596648/article/details/103164362

2020-01-06 16:21:56

阅读数 6

评论数 0

转载 受限玻尔兹曼机(RBM)原理总结

https://www.cnblogs.com/pinard/p/6530523.html

2020-01-06 09:58:01

阅读数 5

评论数 0

转载 docker安装及使用

https://blog.csdn.net/deng624796905/article/details/86493330

2019-12-30 11:49:51

阅读数 1

评论数 0

转载 语音识别|中文语音识别开源数据集整理

包括【st-cmd、primewords、aishell 、thchs-30、magicdata、aidatatang】六个数据集,共计约【1385】小时 https://blog.csdn.net/qq_28385535/article/details/103644423

2019-12-25 09:20:50

阅读数 11

评论数 0

转载 bytes-pair-encoding -- 解决未登录词问题

https://blog.csdn.net/jmh1996/article/details/89286898

2019-12-24 18:19:23

阅读数 4

评论数 0

转载 transformer(attention is all you need)

https://blog.csdn.net/hupengcheng1993/article/details/98933698

2019-12-24 16:04:54

阅读数 6

评论数 0

转载 自然语言处理中的语言模型预训练方法(ELMo、GPT和BERT)

https://www.cnblogs.com/robert-dlut/p/9824346.html

2019-12-24 15:57:58

阅读数 3

评论数 0

转载 DFSMN系列

https://blog.csdn.net/qq_26778411/article/details/89682447

2019-12-24 10:12:08

阅读数 1

评论数 0

原创 pycharm导入torch正常,cmd控制台报错(同一个conda环境)

python解释器版本不同,pycharm用的python3.6,控制台用的python,将控制台改成python3.6即可。 例如: 可以看到,已经不报这个错:no module named torch

2019-12-18 10:14:58

阅读数 6

评论数 0

转载 端到端语音识别时代

https://cloud.tencent.com/developer/news/375304

2019-12-17 16:21:13

阅读数 2

评论数 0

转载 Transformer模型及其语音识别应用

https://www.zhihu.com/question/322027027/answer/673423447

2019-12-17 16:17:48

阅读数 35

评论数 0

转载 Interspeech 2019 | 阿里达摩院语音实验室:联合CTC和Transformer的自动中文纠错模型

http://www.sohu.com/a/340981493_129720

2019-12-17 16:10:12

阅读数 11

评论数 0

转载 LAS模型及相关论文进展

https://blog.csdn.net/weixin_43612049/article/details/101795842

2019-12-17 15:55:16

阅读数 5

评论数 0

转载 论文解读:对端到端语音识别网络的两种全新探索

云从科技基于端到端的语音识别网络进行了两种方法的探索,一种是基于原有的 CNN-RNN-CTC 网络的改进,一种是基于 CTC loss 与 attention loss 结合机制的网络。下面是对这两种方法的详细解读。 1、CASCADED CNN-RESBILSTM-CTC: AN END-T...

2019-12-17 15:48:53

阅读数 18

评论数 0

转载 语音识别 WaveNet

https://www.jianshu.com/p/bb13ae73e427

2019-12-17 14:59:20

阅读数 1

评论数 0

转载 casual Convolution因果卷积、空洞卷积dilated convolution、Hybrid Dilated Convolution (HDC)

1、因果卷积 2、空洞因果卷积 3、HDC https://blog.csdn.net/qq_26369907/article/details/97624028 https://blog.csdn.net/suixinsuiyuan33/article/details/79...

2019-12-17 14:43:04

阅读数 8

评论数 0

转载 BatchNormalization、LayerNormalization区别

BN将每个通道的所有数据进行归一化 LN将每个数据的所有通道进行归一化 将输入的图像shape记为[N, C, H, W],区别就是在: batchNorm是在batch上,对NHW做归一化,对小batchsize效果不好; layerNorm在通道方向上,对CHW归一化,主要对RNN...

2019-12-17 13:41:45

阅读数 6

评论数 0

转载 读完论文要回答的问题

https://blog.csdn.net/yeler082/article/details/78265045

2019-12-17 10:46:31

阅读数 5

评论数 0

转载 token passing model

算法过程大致如下: 初始化(t=0): 初始state(入口处)的Token的s=0 其他state的Token的s=-inf 执行过程(t>0): 复制若干数目Token,并将其传递至所有与该state连接的其他state中,并且对其值做如下操作: 在每个state中,...

2019-11-26 10:00:19

阅读数 10

评论数 0

转载 viterbi算法

已知hmm参数,观察序列,求最可能的状态序列,可用维特比算法。 viterbi算法其实就是多步骤每步多选择模型的最优选择问题,其在每一步的所有选择都保存了前续所有步骤到当前步骤当前选择的最小总代价(或者最大价值)以及当前代价的情况下前继步骤的选择。依次计算完所有步骤后,通过回溯的方法找到最优选择...

2019-11-25 22:46:26

阅读数 5

评论数 0

转载 EM算法推导

(1)初始化参数; (2)找一个Q函数,用初始化参数得到Q; (3)已知Q,最大化似然函数,更新参数; 迭代(2)(3)步骤。 https://blog.csdn.net/zouxy09/article/details/8537620 q函数推导及BW算法:https://blog....

2019-11-25 16:46:44

阅读数 7

评论数 0

转载 HMM前向后向算法

https://www.cnblogs.com/pinard/p/6955871.html

2019-11-25 15:06:21

阅读数 2

评论数 0

转载 隐马尔科夫模型、三个基本问题、三个训练算法

三个问题: (1)已知参数,隐状态,求观察序列的概率(前向后向算法) (2)已知观测序列,求hmm参数(EM算法) (3)已知参数,观察序列,求状态转移序列(viterbi解码、预测) https://blog.csdn.net/lu839684437/article/details/...

2019-11-18 23:29:37

阅读数 4

评论数 0

转载 高斯混合模型(GMM)和EM算法

https://blog.csdn.net/weixin_38206214/article/details/81064625

2019-11-18 22:32:56

阅读数 1

评论数 0

转载 HMM——维特比算法(Viterbi algorithm)

动态规划,已知初始概率矩阵,转移矩阵,混淆矩阵,根据观察序列,求概率最大的路径。 球与盒子的实例:https://blog.csdn.net/zb1165048017/article/details/48578183 ...

2019-11-13 13:11:46

阅读数 6

评论数 0

转载 Kaldi中FST(Finite State Transducer)含义及其可视化

https://www.jianshu.com/p/4ad2add56b25

2019-11-12 15:47:16

阅读数 4

评论数 0

转载 TDNN时延神经网络

TDNN时延神经网络:https://blog.csdn.net/richard2357/article/details/16896837 demo见kaldi中的aishell。

2019-11-11 19:57:16

阅读数 18

评论数 0

转载 线性判别分析(Linear Discriminant Analysis, LDA)

https://blog.csdn.net/pelhans/article/details/80003794

2019-11-11 18:10:22

阅读数 4

评论数 0

转载 从gmm-hmm到dnn-hmm

框架图: 1、特征提取 MFCC特征提取 2、声学模型 (1)gmm-hmm的模型图 gmm-hmm就是把我们的特征用混合高斯模型区模拟,然后把均值和方差输入到hmm的模型里。 (2)dnn-hmm的模型图 (3)dbn-hmm的模型图 3、语言模型 对训练文本数...

2019-11-11 16:39:12

阅读数 13

评论数 0

转载 梅尔频率倒谱系数(MFCC)

提取MFCC特征的过程: 1)先对语音进行预加重、分帧和加窗; 2)对每一个短时分析窗,通过FFT得到对应的频谱; 3)将上面的频谱通过Mel滤波器组得到Mel频谱; 4)在Mel频谱上面进行倒谱分析(取对数,做逆变换,实际逆变换一般是通过DCT离散余弦变换来实现,取DCT后的第2个到第1...

2019-11-11 16:26:30

阅读数 6

评论数 0

转载 Kaldi的下载安装与编译 - ubuntu

https://blog.csdn.net/snowdroptulip/article/details/78896915

2019-11-11 14:09:54

阅读数 2

评论数 0

转载 传统语音识别(GMM+HMM)

https://www.jianshu.com/p/16fc3712fdf6

2019-11-11 14:08:52

阅读数 5

评论数 0

转载 ubuntu14.04 u盘安装教程

https://blog.csdn.net/weixin_41670516/article/details/79151226

2019-11-07 21:32:23

阅读数 3

评论数 0

转载 5 分钟入门 Google 最强NLP模型:BERT

https://www.jianshu.com/p/d110d0c13063

2019-11-06 20:13:53

阅读数 5

评论数 0

提示
确定要删除当前文章?
取消 删除