语音识别
文章平均质量分 77
AI强仔
人工智能爱好者、机器人爱好者
展开
-
自己制作智能语音机器人(基于jetson nano)
主要采用jetson上编写python代码实现,支持离线语音唤醒、在线语音识别、大模型智能文档、在线语音合成。原创 2023-06-08 09:12:52 · 5313 阅读 · 6 评论 -
语音唤醒工具:WeKWS
WeKWS是一个可以投入生产使用、容易构建、易应用的端到端(end-to-end (E2E) )关键词识别工具(Keyword spotting )。Keyword spotting(KWS)指从连续语音流中识别预定义的关键词。唤醒词识别(wake-up word(WuW))是KWS的一种。翻译 2023-04-29 11:31:48 · 2150 阅读 · 0 评论 -
语音特征:spectrogram、Fbank(fiterbank)、MFCC
语音特征:spectrogram、Fbank(fiterbank)、MFCC原创 2022-12-02 15:07:55 · 2985 阅读 · 0 评论 -
语音识别与语音合成--百度PaddleSpeech
语音识别与语音合成--百度PaddleSpeech翻译 2022-12-01 14:20:28 · 1895 阅读 · 0 评论 -
语音识别预训练模型Hidden-Unit BERT (HuBERT)
语音识别预训练模型Hidden-Unit BERT (HuBERT)翻译 2022-11-18 15:44:53 · 7211 阅读 · 0 评论 -
语音识别预训练wav2vec 2.0
语音识别预训练wav2vec 2.0翻译 2022-11-14 17:15:11 · 3646 阅读 · 0 评论 -
语音识别VQ-WAV2VEC+BERT
语音识别VQ-WAV2VEC+BERT翻译 2022-11-13 21:55:32 · 852 阅读 · 0 评论 -
WAV2VEC:语音识别非监督预训练模型
WAV2VEC:语音识别非监督预训练模型翻译 2022-11-12 16:05:38 · 940 阅读 · 0 评论 -
语音识别kaldi初体验
语音识别kaldi初体验转载 2022-11-09 11:47:23 · 439 阅读 · 0 评论 -
语音识别DNN-HMM
语音识别DNN-HMM原创 2022-11-02 17:35:03 · 644 阅读 · 0 评论 -
语音识别GMM-HMM
语音识别GMM-HMM原创 2022-11-02 17:33:24 · 1546 阅读 · 0 评论 -
语音识别工具kaldi简介
语音识别工具kaldi简介原创 2022-10-27 14:28:36 · 4312 阅读 · 0 评论 -
Tacotron2--语音合成
1 简介本文根据2018年《NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS》翻译总结的。通过标题可以看出来Tacotron 2包括Tacotron 和WAVENET。Tacotron 2是一个可以直接从文本合成语音的神经网络模型。有两部分构成,第一部分是循环序列到序列的特征预测网络,其将字符embedding转换为mel-scale 频谱(SPECTROGRAM);第二部分是修改的WaveNet模型翻译 2021-11-18 23:15:40 · 2438 阅读 · 0 评论 -
普通话/汉语的语音识别:DFSMN-CTC-SMBR模型
1 简介本文根据《Investigation of Modeling Units for Mandarin Speech Recognition Using Dfsmn-ctc-smbr》翻译总结。采用DFSMN-CTC-SMBR进行普通话语音识别。一般一个声学模型包括3个关键部分,分别是:神经网络、声学模型单元、优化目标函数。本文采用DFSMN-CTC-SMBR,即神经网络是DFSMN,目标函数是CTC与SMBR。声学模型采用的是hybrid Character-Syllable,包括常见的中文字符翻译 2020-12-06 19:37:13 · 3158 阅读 · 0 评论 -
语音识别技术分类与总结
语音识别技术分类与总结原创 2020-04-22 18:12:12 · 1439 阅读 · 0 评论