对话系统简介与OPPO小布助手的工程实践

本文介绍了对话系统在智能助手中的重要性,以OPPO的小布助手为例,阐述了对话系统的设计、演进和工程实践。小布助手在对话系统架构上采用了经典Pipeline模式,随着技能覆盖和意图识别的优化,逐步提升对话体验。文章还探讨了业界对话系统如微软小冰、小蜜机器人和开源方案rasa的特点。最后,小布助手在性能优化和未来挑战方面的实践和展望被提及,包括预测执行策略和对话系统组件化解耦等方向。
摘要由CSDN通过智能技术生成

前不久,OPPO旗下的人工智能助手“小布助手”月度活跃用户数突破一亿,成为国内首个月活用户数破亿的手机语音助手。

经过2年多的成长,小布助手在能力上实现大幅升级,也融入了我们身边便捷的服务功能。小布团队亦克服了诸多技术难点,为用户带来了更智能的服务。为此,小布团队撰写了一系列文章,详细介绍小布助手背后的技术支撑。本文是揭秘小布背后技术的第一篇,主要介绍系统架构设计和演进。

1. 行业价值

1.1 前言

对话系统是一项接近30年研究历史的技术,代表人机交互的未来。近十年来随着语音、NLP领域的阶段性突破和工业界应用日趋成熟,用户价值、行业规模迅速上升。

从场景来看,对话系统大致分为三类

  • 任务型:答案精确,限定领域,以最简交互满足用户为目标,比如定闹钟。

  • 问答型:答案宽泛,限定领域,以最简交互满足用户为目标,比如百科。

  • 闲聊型:答案宽泛,开放领域,以对话轮次为目标。

智能助手是以任务型为主,融合问答型、闲聊型,集大成的对话系统产品形态,行业价值潜力巨大。

1.2智能助

AIoT时代来临,万物互融背景下,智能设备群越来越依赖智能助手进行自然的人机交互。智能助将覆盖千千万万设备,拥有巨大想象空间。

英国市场调研公司Juniper Research预测,到2023年,搭载智能助的设备将从2018年底的25亿部增加到80亿部。

用户层面来说,智能助虽然属于小众功能,但是随着智能设备的普及,以及早期用户的逐步培养,熟悉度和认知度在逐步上升,有着较大的上升空间。

智能助带来的用户价值有三层

  1. 效率
  2. 个性
  3. 情感

随着行业进一步普及,在小屏、无屏、大屏的基础上,逐渐延伸出更多针对垂直场景和人群的智能设备,如教育智能屏、故事机、AI学习机等。

小布助手是OPPO公司的智能助,覆盖公司的各类终端设备,并不断增加新入口,覆盖众多任务型、问答型和闲聊型的垂域。

对话系统作为智能助中的“大脑”,是最核心的技术点之一。有对话系统,智能助手才能理解用户的诉求,用对话式的服务满足用户效率、个性、情感上的需求。

2. 业界架构

2.1 综述

首先介绍对话系统的典型架构。在学术界,对话系统主要有Pipeline和E2E两种架构,其中Pipeline在工业届应用较多,E2E还处在探索阶段。

Pipeline模块化架构

ASR(语音识别Automatic Speech Recognition)

接收音频输入,输出一个转录的句子文本。一般包括四大块:信号处理、声学模型、解码器、后处理,首先采集声音,进行信号处理,将语音信号转化到频域,从N毫秒的语音提出特征向量,提供给声学模型,声学模型负责把音频分类成不同的音素,接着解码器得出概率最高一串词串,最后的后处理

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值