![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
AItrust
AI_Computer Vision
展开
-
语音识别 Speech recognition 中的 CTC cost,CTC损失函数(学习心得)
seq2seq 模型在语音识别方面的应用让人激动!什么是语音识别问题呢?气压随着时间推移不断变化,产生了音频人的耳朵可以衡量不同频率和强度的声波输入整个原始的音频片段 raw audio clip生成一个声谱图 generate a spectrogram(横轴是时间,纵轴是声音的频率,颜色显示声波能量的大小)伪空白输出 false blank outputs:经常用于预处理步骤,在输入到神经网络之前过去一段时间,语音识别是基于音位 phonemes 来构建的而音位是由人工设计而成 h原创 2020-05-08 22:05:57 · 1479 阅读 · 5 评论 -
对话式AI操作系统架构(学习心得)
什么是对话式操作系统以智能IoT设备(如智能音箱)为依托平台的操作系统在这个操作系统上,开发者可以进行应用程序的开发对话式操作系统的请求流程以百度的DuerOS为例:用户发出语音指令智能音箱收集音频流语音识别,将语音转化为文本文本请求在系统内转化为请求指令,发送给对应的应用服务应用服务处理请求,生成回复语音合成,将应用服务的回复结果以音频形式输出与传统web服务的区...原创 2020-04-28 20:37:40 · 1244 阅读 · 0 评论 -
AI语音技术的架构(学习心得)
AI 语音技术架构:AI的语音技术现在在各种终端上都已经普及开,比如个大厂商的智能音箱,都运用了该技术。以智能音箱为例,AI语音技术的架构为:首先人类通过唤醒词,唤醒设备发出语音指令:比如“今天天气如何?”通过语音识别技术,将语音信息转化为文本信息文本信息通过NLP技术理解其内在含义通过深度学习模型/或者问答库找到合适的答案通过NLP技术形成答案的文本通过语音合成技术将文本信...原创 2020-04-26 19:52:04 · 3041 阅读 · 0 评论