对话模型背后可以做更多事

前言

之前几篇我们已经接连介绍过一些对话系统方面的综述,比如包括一些业界最新的模型和研究热点,感兴趣的小伙伴们可以穿梭到如下文章~

最新对话系统综述 - 知乎

对话系统最新综述II - 知乎

今天我们要介绍的这篇也是最新的一篇paper,其关注点是目前对话系统虽然好,尤其在一些任务型对话场景下已经有落地的产品了,但是其在对话过程中还缺失捕捉人类话语背后的情感、目的意图等等;而这些其实至关重要,比如对于一些商家这些客户的情感将会直接影响其对自己产品的评级等等。而这些能力的缺失确实也导致人类在和机器人聊天中聊着聊着就不想聊了,毕竟在真实的人类对话中,上述能力都是最基本的对话技巧。

本篇就试图解决一下这个问题,让我们一起来看一下吧~

论文链接:https://arxiv.org/ftp/arxiv/papers/2201/2201.02735.pdf

总体框架

​框架

作者首先将上述问题量化归类成几个NLP领域常见的任务,如上图中的情感分析、意图识别、实体识别等子任务。依靠这些任务的结果辅助模型理解人类话语背后的更深沉的语义。下面我们拆开一个一个看。

Sentiment Analysis

这个就是一个简单的感情分类任务即positive或者negative。

数据集这里用了两个即IMDB和twitter sentiment analysis dataset。作者对这两个数据重新进行了整理和合并,数据清洗流程如下:

模型的话,这里试了几个常见的分类模型,最后经过实验发现LSTM最好

最后还给了几个直观的case

Emotion Detection

这个也是个情感分类任务,相比于上述的区别在于对情感分类更加的细粒度,具体的是七种感情即joy、sadness、fear、anger、guilt、disgust和shame。

用到的数据集是International Survey on Emotion Antecedents and Reactions (ISEAR) database,清洗流程作者也给了出来:

模型的话作者试了两种常见的模型即GRU和LSTM,效果如下

具体的case

添加图片注释,不超过 140 字(可选)

Intent Classification

这是一个意图分类任务,用以判断用户说话背后的意图,用到的数据集是banking-77 ,其包含了78个意图,数据清洗流程如下:

同样实验了两种模型

具体case

可以看到上述同时给出了一句话背后对应的情感和意图。

Named-Entity Recognition

这里是个命名实体识别任务,它的初衷在于想去得到意图的一些更具体的信息,因为命名实体识别可以抽取出地点、时间、人名等等,这些就是更具体的意图啦。

数据集用到的是Groningen Meaning Bank,具体的清洗流程:

实验的模型

具体的case

​总结

(1)看完这篇paper我们的收益是什么呢?是不是感觉都是很简单的NLP任务?笔者觉得一个最大的收益就是一个产品idea:也就是说对话这个模型落地场景其实可以多种多样,我们的机器人可以正常对话,但是通过对话辅助我们拿到了一些语料,而这些语料可以通过背后的各种需求进行分析进而进行后续一些其他任务,不限于paper中的一些任务,甚至可以针对性的生成对话进行交互,这就将对话和传统的NLP任务进行级联,体现了对话模型落地的价值。所以从这个角度看,对话模型的一个落地价值在于:获取真实数据。(当然哈,这里不考虑隐私,不允许拿隐私数据进行数据分析等等,那是另外一个话题了,如果不允许,是坚决不能做的)。

(2)要完成本篇paper的任务,其实并不难,任务都是一些很中规中矩的任务,模型一大推,要说难点的话还是相应数据集的获取,只要有了对应的数据集,模型的话就是随便拿一些常见的分类模型跑跑都不会太差,整个事情就可以run起来。关于各个任务的中文数据集其实也不少了,这个推荐一下百度的千言数据集,包含了各个NLP任务的数据集,感兴趣的小伙伴可以去瞅瞅。

关注

欢迎关注,下期再见啦~

欢迎关注笔者微信公众号:

 github:

https://github.com/Mryangkaitong​github.com

知乎:

小小梦想 - 知乎

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值