自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 国内那几家在线语音合成做得比较好?

在线语音合成,是指将文字转化为自然流畅的人声,广泛应用于新闻阅读、出行导航、智能硬件和通知播报等场景。目前,国内在提供在线语音合成技术的厂商主要有:1、科大讯飞提供100+发音人,支持19个语种、11种方言、2种民族语言,支持中英混合自然合成 。广泛应用于新闻播报、智能硬件、电话客服、出行导航、有声阅读、无障碍播报等场景。除了主流平台外,还支持最新的HarmonyOS平台。2、 百度智能云提供19种音库,支持中文、英文、中英文混读合成。在阅读听书、资讯播报、订单播报、智能硬件等场景均有应

2022-04-15 15:57:56 3278

原创 国内那几家离线命令识别做得比较好?

离线命令识别,是指用户对设备(手机、玩具、家电等)说出操作指令(即“命令词”),设备即作出相应的反馈,开启语音交互。与在线语音相比,离线命令识别具有响应快,不依赖网络的优点。但是,离线的SDK包相比在线更大,由于本地计算能力和存储空间的限制,离线资源相对小点。目前,国内提供离线命令识别技术的厂商主要有:1、科大讯飞深圳证券交易所挂牌上市公司,一直深耕在人工智能领域,技术很全也很综合,多次在语音识别、语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等各项国际评测中取得佳绩。202

2022-04-13 14:13:51 647

原创 国内那几家语音听写技术做的比较好?

语音听写,是指将短音频(≤60秒)精准识别成文字,实时返回结果,达到边说边返回的效果。除了要考虑本身语音听写模型或算法的识别准确率之外,一些智能硬件的产品还需要额外考虑降噪、回声消除、去混响等因素,这些都是保证最后识别效果的重要因素。因为涉及软硬件,对能力交付方的项目经验提出了较高的要求。目前,国内提供语音听写技术的厂商主要有:1、科大讯飞成立于1999年,2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。一直深耕在人工智能领域,技术很全也很综合,多次在语音识别、语音合成、

2022-04-08 11:27:34 2532

原创 国内那几家语音唤醒技术做的比较好? 语音唤醒技术哪家强?

编辑导语:随着语音交互技术的日渐成熟,越来越多的智能硬件都选择增加语音能力作为产品卖点之一。但是,设备在进入语音交互工作状态的时候,需要先进行唤醒操作。常见的唤醒语音交互的操作有按键或者触屏形式,但是,为了进一步降低学习成本和操作复杂度,也有不少的智能硬件选择通过语音唤醒的方式来激活交互功能。本文将综合对比市面上各家提供的语音唤醒技术相关指标,可以帮助你快速掌握语音唤醒技术的情况。一、语音唤醒技术的相关核心指标1、唤醒率语音唤醒的主要目的既然是激活设备进入交互工作状态,那么,唤醒.

2022-03-24 11:09:15 3341

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除