离线语音识别和在线语音识别都是语音识别技术的一种,但它们有一些不同之处。
离线语音识别是指在设备本地使用的语音识别技术,这种技术不需要连接互联网或云服务进行语音识别,因此也被称为本地语音识别。离线语音识别通常通过端侧语音AI芯片来处理数据,因此识别速度更快,同时也更安全和隐私保护。
在线语音识别是指通过网络连接到云服务进行的语音识别技术。用户可以通过互联网连接到云服务进行语音识别,云服务会将用户的语音传输到服务器进行处理,然后将识别结果返回给用户。在线语音识别通常需要较高的网络带宽和较长的延迟时间,同时也有较高的安全风险。
总体来说,离线语音交互相对于在线语音交互有以下一些优势:
1、响应速度更快:离线语音交互不需要依赖互联网,直接在本地设备上进行处理,因此响应速度更快,可以更快速地完成语音识别和语音合成等处理。
2、更好的隐私保护:在线语音交互需要将语音数据上传到云端进行处理,可能存在隐私泄露的风险。而离线语音交互则直接在本地设备上进行处理,语音数据不会被上传到云端,更好地保护用户的隐私。
3、更高的稳定性:在线语音交互需要依赖网络环境,如果网络环境不好或者出现故障,就可能会导致语音交互无法进行。而离线语音交互则不需要依赖网络环境,更加稳定可靠。
4、更节省流量和电量:在线语音交互需要上传和下载大量的语音数据,会消耗用户的流量和设备的电量。而离线语音交互不需要上传和下载语音数据,更加节省流量和电量。
离线语音识别更适合于需要较快响应速度和保护隐私的场景,如家居设备、智能音箱、移动设备等;在线语音识别更适合于需要实时交互和处理海量语音数据的场景,如语音转写、语音翻译等。选择离线语音识别还是在线语音识别,需要根据具体的应用场景和需求进行选择。
启英泰伦于2015年成立,至今已发布三代离线语音芯片,具备高性能、高集成、高可靠性、低功耗、低成本等优势。
2022年,推出AIoT芯片CI230X系列(CI2305、CI2306),该系列芯片集成了启英泰伦自研的脑神经网络处理器BNPU V3,以及WIFI和BLE功能,是集“语音+WIFI+BLE”于一体的三合一AIoT芯片,且仅需少量电阻电容等外围器件就可以实现各类智能语音离在线产品硬件方案,性价比极高。在语音算法上,支持语音识别、单麦深度学习降噪、离线自然语言处理、双麦深度人声分离、命令词自学习2.0版本等,最多可支持500条命令词。CI2306还支持声纹识别及离线NLP。
2022年,推出CI1312语音AI芯片,该芯片集成BNPU V3,系统主频可达220MHz,内置高达640KByte的SRAM,算力可以更加充分的提供给主控应用方案。采用SOP16封装,引脚更宽,便于生产贴片,贴片成本更低,另集成RC振荡器,增加串口自适应功能后可免晶振应用。可实现语音识别、声纹识别、命令词自学习、语音检测及深度学习降噪等功能,具备强劲的环境噪声抑制能力。
2021年,推出语音AI芯片CI130X系列((CI1301、CI1302、CI1303、CI1306)。该系列芯片集成BNPU V3,高主频(240MHz),更大SRAM,算力更强。采用SSOP24/QFN40两种封装,可适应不同应用及贴片要求。集成度更高,外围精简,除MIC,喇叭外,板级仅需要阻容、PA芯片。可实现单麦降噪、AEC、双麦增强、双麦定向等功能,另CI1303、CI1306还支持声纹识别,500+命令词条及离线NLP。
2020年,推出语音AI芯片CI1122,该芯片集成BNPU V2,成本更低,性价比更高。
2019年,推出行业首款降噪识别一体语音AI芯片CI110X系列(CI1102/CI1103),支持离线远场语音识别,离线+在线语音识别,离线+AIoT语音场景联控,且集成更丰富(集降噪拾音、麦阵处理、ASR、MCU控制等功能为一体),成本更低(和DSP、MCU芯片同量级),功耗更低(待机功耗是实现相同功能性能的AP芯片的十分之一以下)。经科技成果评价,成果水平达到国际先进(证书编号:202051ZK3713),并入选AIIA发起的《AI芯片技术选型目录2020年》。
2018年,推出语音AI芯片CI1002,该芯片在保持CI1006性能优势的基础上成本更低,应用领域更广泛。
2016年,启英泰伦推出行业首款深度神经网络语音AI芯片CI1006,开启了智能语音离线控制智能家电,奠定了启英泰伦在离线语音家电领域的领先地位。经科学技术成果评价属国内首创(证书编号:9562018Y0009),也是唯一一款入选《人工智能浪潮》书籍的语音芯片。
基于此系列语音芯片同时推出了丰富全面的各类产品解决方案,现已应用于智能家居、智能家电、智能照明、智能玩具、智能机器人、智能汽车等领域。