语音识别
文章平均质量分 88
我把葡萄酿成酒
吾日三省吾身
展开
-
语音识别系统及科大讯飞最新实践
语音作为最自然便捷的交流方式,一直是人机通信和交互最重要的研究领域之一。自动语音识别(Automatic Speech Recognition,ASR)是实现人机交互尤为关键的技术,其所要解决的问题是让计算机能够“听懂”人类的语音,将语音中传化为文本。自动语音识别技术经过几十年的发展已经取得了显著的成效。近年来,越来越多的语音识别智能软件和应用走人了大家的日常生活,苹果的Siri、微软的小娜、科大讯转载 2016-08-28 21:14:20 · 8632 阅读 · 0 评论 -
语音识别的痛点在哪,从交互到精准识别如何做?
语音识别是目前应用最成熟的人机交互方式,从最初大家体验过的有屏手持设备这种近场的语音识别,如Siri以及各种语音助手,到现在,语音识别的应用已经完成了向智能硬件以及机器人上延伸,不过,新的人机交互对硬件、算法要求更加苛刻,各企业正面临着巨大的挑战。那么实现人机交互需要解决哪些问题?这其中的关键技术有哪些?人机交互的未来趋势如何?本期硬创公开课邀请了科大讯飞的研发主管赵艳军为大家答疑解惑。 分享嘉转载 2016-08-28 22:33:13 · 20079 阅读 · 0 评论 -
语音专题第三讲,声学模型
语音技术在近年来开始改变我们的生活和工作方式。对于某些嵌入式设备来说,语音成为了人机交互的主要方式。出现这种趋势的原因,首先是计算能力的不断提升,通用GPU等高计算能力设备的发展,使得训练更复杂、更强大的声学模型(Acoustic Model, AM)变得可能,高性能的嵌入式处理器的出现,使语音识别的终端应用变得可能。 声学模型是人工智能领域的几大基本模型之一,基于深度学习的声学模型发展对于人工智转载 2016-09-01 10:16:06 · 14163 阅读 · 0 评论 -
语音专题第三讲,语言模型
语言模型技术广泛应用于语音识别、OCR、机器翻译、输入法等产品上。语言模型建模过程中,包括词典、语料、模型选择,对产品的性能有至关重要的影响。语言模型的建模需要利用复杂的模型公式进行模拟计算,是人工智能领域的关键技术之一。 曹立新,2011年7月毕业于哈尔滨工业大学计算机科学与技术专业,曾任百度语音资深研发工程师。负责百度超大语言模型训练,语音交互技术研发以及语音搜索、语音输入法、语音助手等产品转载 2016-09-01 10:35:38 · 3275 阅读 · 1 评论 -
Ubuntu上安装Kaldi
什么是Kaldi? Kaldi is a speech recognition toolkit, freely available under the Apache License. 注意,Kaldi仅仅是一个工具包,不是一个语音识别框架,想做语音识别,框架还要自己写。这里有一系列ASR开源软件的比较: https://en.wikipedia.org/wiki/List_of_speech_原创 2016-09-01 20:08:51 · 1799 阅读 · 0 评论 -
OpenBlas, Neon & VFP
OpenBlasIn scientific computing, OpenBLAS is an open source implementation of the BLAS (Basic Linear Algebra Subprograms) APIwith many hand-crafted optimizations for specific processor types. It is dev原创 2016-09-05 12:07:17 · 2297 阅读 · 0 评论