中国智能语音助手企业案例研究报告(2018年)-笔记

中国智能语音助手企业案例研究报告(2018年)-笔记

1 摘要

目前行业里的智能语音助手主要应用于消费级产品和专业级行业应用两大领域。
智能语音助手的卖点是:想通过语音操控从而解放双手,并且智能语音助手对语音语义识别的准确性成为了用户选择及使用时最重要的考量因素。

2 概念

人工智能核心的三大基础技术:计算机视觉、智能语音和机器学习。
智能语音技术:语音识别ASR、语音合成TTS、自然语音处理NLP。

3 智能语音交互系统的技术流程

智能语音交互系统的技术流程

智能语音技术研究的是人与计算机以自然语音的方式进行有效的沟通的方法,包含了机器翻译、阅读理解、对话问答等。
声纹识别可以根据声纹特征识别出说话人的身份,语音识别技术在远场、抗噪、多人等条件下识别有待提升。

4 智能语音产业图谱

产业链分为:基础研究机构、语义数据提供商、语音技术提供商、智能语音应用提供商。

  • 基础研究机构(上游基础层):语音合成、语音识别、声纹识别等基础技术的研发和技术输出。

  • 语义数据提供商(上游基础层):算法研究和技术输出机构提供语音、语义数据库及定制化的数据采集和处理。

  • 语音技术提供商(中游技术层):将基础技术转发为软件或行业整体解决方案,提供嵌入式或平台式的语音软件服务、行业智能语音系统整体解决方案。

  • 智能语音应用提供商(下游应用层):有智能移动设备、智能车载设备、智能家居等智能终端厂商,以及输入娱乐等各类APP或软件客户端等。

5 智能语音助手应用场景

应用于消费级产品和专业级行业应用两大领域。

中国智能语音助手应用场景

6 用户尝试智能语音助手原因

  • 实用性:操作方便智能,解放双手
  • 新鲜感:探索尝试人工智能等新事物
  • 省时:助手执行能力强,节省时间
  • 有趣:好玩,可以调戏助手
  • 随大流:跟随大众潮流

7 用户使用智能语音助手的满意度

  • 2018年国内用户在使用智能语音助手在意的地方:语音/语义识别的准确度、人机交互的舒适度、对工作及生活能否产生帮助、安装在设备上占用的存储空间、消耗流量的多少。
  • 2018年国内用户认为只能语音助手有待完善的地方:语音/语义识别的准确度、回答的响应速度、能够自主学习用户语料、增加更多新功能、声音的动听程度、手机界面的美观度。
时下带有语音助手功能的智能网关产品越来越流行,比如小米的智能音箱,天猫精灵等等互联网公司都纷纷推出基于智能家居环境应用的网关产品包括家用的节点设备。这种网关最大的体现了语音识别技术,基于云端的数据安全技术,同时又结合Wi-Fi技术实现一系列智能化应用产品的互联互通。目前市面上销售的产品基本上都是以MTK以及Rockchip,Realtek等等成本较高的方案为主。出于成本因素,Microchip推出了一款基于ATSAMG55J19A-MU+WINC1500B为主的完整的解决方案,该方案在Amazon已经形成产品化。 对于基于Amazon Alexa 的Microchip语音助手解决方案。结合Amazon电商购物平台,又支持Amazon一键WiFi购物的功能,一键Wi-Fi购物,就是您可以按下自动定购已经标记的产品来购买商品,同时也可以对其直接语音告诉它你要想购买的商品。 Amazon New Amazon Dash Wand “魔棒”已经量产,相信国内的电商巨头也会将这种便捷快捷的购物方式引入到国内市场。 核心技术优势1. 150mS快速回连AP 2. 超300款AP 兼容测试 3. 支持AWS ,阿里云,微软云 4. 提供主机端驱动原码 5. 提供多种安全连接云应用的参考例子 方案规格ATSAMG55: 1:Cortex-M4内核,FPU。主频可达到120MHz。 2:超低功耗 (1)在运行模式只有 100 µA/MHz。 (2)在深度睡眠SRAM保持模式下: 7 µA 。 (3)从深度睡眠到工作模式,唤醒时间只需要 3 µs。 3:Flash:512KB/SRAM:176KB。 4:工作电压:1.62V to 3.6V 5:温度范围:-40 ℃to 85℃ 6:片上集成UART,ADC.SPI,USB等丰富的外设接口。 WINC1500: 1:支持2.4GHz b/g/n IoT网络控制器。 2:超低功耗。 3:工作电压: 3.0V to 4.2V。 4:接口: SPI。 5:支持安全协议: WPA/WPA2 Personal, TLS, SSL。 6:支持网络服务: DHCP, DNS, TCP/IP (IPv4), UDP, HTTP, HTTPS。 7:Chip 和 PCB 天线(ATWINC1500-MR210PBxxxx) 8:Chip 和u.FL (ATWINC1500-MR210UBxxxx) 9:ATWINC1500-MR210PBxxxx (4Mb flash)和ATWINC1510-MR210PBxxxx (8Mb flash)。 10:开发环境支持Atmel Studio 7 - 可查阅ASF笔记。 11:认证: in the US, Canada, Europe, Japan, Korea, China, India 和Taiwan。 方案来源于大大通。
Voicebot.ai发布了“2018语音购物报告”。语音有望成为第三大网络购物渠道,加入网络和移动。根据预测,到2022美国消费者利用语音购物的支出将达到400亿美元。 消费者正在转向语音界面来发现产品、比较交易和完成购买。大部分媒体和分析师都认为智能音箱的快速采用导致语音购物的崛起,但是整个故事可能更加细致入微。 语音既是一个频道,也是一个推动者 确实,语音本身已经代表了一个消费者购物渠道。人们只需用亚马逊Alexa或Google智能助理即可通过即时语音识别来进行语音购物。而且,语音也是网络和移动网上购物的推动者。网站和移动应用程序开始添加语音交互,作为其传统点击和触摸界面的补充。 这增加了便利性并引入了全新的功能。 超过50%的语音购物是在智能手机上完成的 智能音箱显然引起了人们对语音交互的极大兴趣,但目前超过一半的语音购物活动是通过智能手机进行的。调查发现,79%的美国成人拥有智能手机,但是只有21%的美国人拥有智能音箱。智能手机的普及率很高,意味着人们更可能用移动设备进行首次语音购物。 语音购物的未来 零售商和品牌开始部署语音电子商务,他们需要一个综合的策略。考虑到智能音箱购物的兴起,零售商和品牌应当在其应用和网站中添加语音。到2020,预计30%的网页访问量将是通过语音进行,而且语音将占所有搜索量的50%。而语音搜索将是语音购物的门户。那些支持语音购物功能的产品将在未来几具有显着的优势。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值