Gavin老师Transformer直播课感悟 - 基于Transformer的Recipes for building an open-domain chatbot论文解析(一)

一、概述

        本文围绕下面这篇论文来解析如何基于各种组件来构建一个基于开放领域的对话机器人。

        在这篇论文里谈到了很多技术,虽然是针对开放领域来说的,但是对于面向业务的对话机器人来说仍然有参考和借鉴的作用。论文标题重点词”Recipes”就是配方或者食谱,包含了两层意思,第一层意思是它的组成成分,对模型或者系统来说就是组件,第二层意思是规定的做法或者说明。

        在机器学习领域,构建一个面向开放领域的对话机器人是非常有挑战的。之前的研究表明,神经网络模型在扩大参数数量和数据集尺寸规模的情况下可以改善模型的表现。论文提出了对于构建一个高性能的对话机器人来说需要考虑的一些重要方面。好的对话要求具有一系列的技能,如同一个专业的健谈的人可以无缝地混合运用以下几个方面:

-提供吸引人的谈话内容,并能够倾听对方的谈话

-在谈话中展示出富有知识的一面,能够引起对方共鸣,以及个性的展示等来维持一种人物特征

        研究表明大规模的模型在给定合适的训练数据和对话生成策略时,能够学习以上这些对话技能,这里也体现了迁移学习的做法。另外关于对话生成策略,有这样一个理论“Shannon theory”,它包含了关于表达信息交流的数学机制,其中一个点是如何以最小的存储空间来表达信息,如何在不确定的状态下以最短的路径获得一个确定的信息,这就会涉及到获取信息的不同步骤,每个步骤具有不同的权重信息,一般在运用生成策略时,会加入bias的信息,譬如以知识库(knowledgebase)的内容来提示生成器来生成相应的内容,换句话说,Transformer对于不同输入的内容,可能其输出内容对应的概率都差不多,如果在输入内容中加入了来自知识库查询的内容,那么在输出时就会极大地提高某些内容所占的概率,从“Shannon theory”的entropy的角度讲,就会让entropy下降,这是因为由于具有了更多的信息而让原先不确定的状态因为有的内容具有更高的概率而在选择时具有较大的确定性。

二、讨论

        根据人工评价结果,论文提到的一些方法在对话内容吸引力和人性化方面达到了一定的改善,但是仍然没有找到一个关于开放领域对话机器人的解决方案。对于开放领域的对话机器人研究,相当于在通用人工智能领域进行的研究,人工智能的模型在训练时都是需要有参照依据的,随着Transformer的运用,大多数情况下是采用自监督学习的机制,不同领域的数据应用到同一个预训练模型,有可能存在冲突的情况,即在一个领域表现好的模型,运用到另一个领域时,会出现模型质量变差的情况。

论文提到了即使是基于论文作者训练的表现最好的模型,仍然会产生各种错误:

-模型之间表现出冲突或者自我矛盾的方面

-同样的语言表达重复出现在不同的对话里

-对话中出现类似幻觉表达的情况(正常情况下不会发生的情况)

对于上面出现的语言表达重复出现的问题,可以通过使用unlikelihood技术和基于已有的知识的条件下去试图纠正。

        如果使用的对话长度越长,那么上面这些问题出现的情况就越严重。另外一种做法是指定对话的主题或者通过评估给予用户提示来让对话聚焦于某一方面。在对话建模时,更长的对话可以使提供给对话机器人的上下文材料的选择变得更凸显而比较容易选择。除了有助于维持一致性之外,人物特征和主题被用于作为”Blended Skill Talk”里的初始化上下文,从而可以帮助模型引入有趣的谈话内容。然而人物特征和主题对于更长的对话或者可重复的对话来说,需要更进一步地细化来帮助模型维持对话一致性状态而避免出现对话重复的情况。基于模型被训练的上下文,可以被用来配置与给定期望的角色匹配的具有相应特征的这样一个对话机器人。

        对于部署一个具有良好对话行为的对话机器人,仍然是一件非常有挑战的事。特别是,期望机器人能够比人类更具有对话完整性方面,但是机器人比起人类来说它们不能理解它们正在说的内容。论文也提到了对于开放领域的对话机器人所面临的内容安全性检查方面仍然有大量的工作需要做。现在的人工智能技术主要还是从概率统计的角度出发来处理问题,对话机器人并不能理解语言本身,

在进行语言模型训练时,下面这些因素也是不可忽略的:

-训练数据的选择对于模型的表现是非常重要的

-即使针对同等复杂度的模型,不同的decoding算法也会造成很大的差异,这里的decoding算法就是指生成内容的算法,譬如业界常用的beam search

论文提到的具有2.7B参数的模型的表现胜过了90M参数的模型,而对比最大的9.4B参数的模型的表现和2.7B参数的模型,并没有明显的优势。

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值