本发明涉及语音识别技术领域,特别涉及一种提升语音识别准确率的方法。
背景技术:
人机交互是通过输入,输出设备,以有效的方式实现人与机器对话的技术。已广泛应用在消费电子,通信,家电,医疗,汽车等各个行业。主要有基于传统硬件设备的交互技术,基于触控的交互技术,基于语音识别的交互技术等。近年来,随着人工智能的发展以及计算机处理能力的增强,使得语音识别技术日趋成熟并被广泛应用于智能终端上。电视行业也是人机交互比较频繁行业,之前的用户大部分都是通过遥控键来选择和点播电视节目,通过集成人工智能模块,以语音的方式来和电视机进行人机交互,可以用比较简单便捷的方式来操作电视机和获取各项信息,跳过了之前繁琐的设置功能选项和操作。因此,语音识别的效果就直接关系到了用户对产品的体验与评价,改善用户交互体验成为了消费电子,家电产品的核心需求之一。
目前市面上支持语音交互的电视机越来越多,基本上都是以普通话作为语音输入。但是每个人的普通话发音都或多或少存在不标准的情况,再加上一些的同音字的影响,导致语音识别的准确率随着不同的人存在比较明显的差别。而大部分的电视机都没有提供语音识别的纠错功能,导致对于错误识别的语音,一旦识别错误,后续无法进行修正,严重影响用户体验。考虑到电视机、家用空调、音箱等的使用用户是以家庭成员为主,使用的人数基本限定在个位数。所以可以通过建立针对当前使用用户的语音数据库,将那些无法通过标准语音库识别的语音数据存入数据库中,来解决某些特定语音输入无法识别和识别准确率低的