![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
AItrust
AI_Computer Vision
展开
-
语音识别 Speech recognition 中的 CTC cost,CTC损失函数(学习心得)
seq2seq 模型在语音识别方面的应用让人激动! 什么是语音识别问题呢? 气压随着时间推移不断变化,产生了音频 人的耳朵可以衡量不同频率和强度的声波 输入整个原始的音频片段 raw audio clip 生成一个声谱图 generate a spectrogram(横轴是时间,纵轴是声音的频率,颜色显示声波能量的大小) 伪空白输出 false blank outputs:经常用于预处理步骤,在输入到神经网络之前 过去一段时间,语音识别是基于音位 phonemes 来构建的 而音位是由人工设计而成 h原创 2020-05-08 22:05:57 · 1477 阅读 · 5 评论 -
对话式AI操作系统架构(学习心得)
什么是对话式操作系统 以智能IoT设备(如智能音箱)为依托平台的操作系统 在这个操作系统上,开发者可以进行应用程序的开发 对话式操作系统的请求流程 以百度的DuerOS为例: 用户发出语音指令 智能音箱收集音频流 语音识别,将语音转化为文本 文本请求在系统内转化为请求指令,发送给对应的应用服务 应用服务处理请求,生成回复 语音合成,将应用服务的回复结果以音频形式输出 与传统web服务的区...原创 2020-04-28 20:37:40 · 1243 阅读 · 0 评论 -
AI语音技术的架构(学习心得)
AI 语音技术架构: AI的语音技术现在在各种终端上都已经普及开,比如个大厂商的智能音箱,都运用了该技术。 以智能音箱为例,AI语音技术的架构为: 首先人类通过唤醒词,唤醒设备 发出语音指令:比如“今天天气如何?” 通过语音识别技术,将语音信息转化为文本信息 文本信息通过NLP技术理解其内在含义 通过深度学习模型/或者问答库找到合适的答案 通过NLP技术形成答案的文本 通过语音合成技术将文本信...原创 2020-04-26 19:52:04 · 3037 阅读 · 0 评论