Dialog System Using Real-Time Crowdsourcing and Twitter Large-Scale Corpus

聊天系统结构如下:

这里写图片描述
(1)从web爬取料聊天语料,制作聊天对话,即Utterance Pair Corpus.

(2)用户输入聊天语句,即user input,将user input与(1)中的聊天语句匹配,当匹配置信度大于某一阈值时,得到最佳的匹配作为回答,即response.

计算与输入最相似的句子作为回答,首先计算每个句子d的词wi的向量表示:

xi=tfi/ni

tfi 为词wi在句子中出现的次数,ni表示该句子包含的词的总数.

句子d的所有词的向量组合得到句子d的向量表示.

对于两个句子d1,d2,计算其向量da,db,计算句子相似度如下:

similarity(da,db)=xTaxb

对于输入query,首先查找本地中所有response与其的相似度,得到相似度最大的response.

(3)如步骤(2)中没有得到匹配对,则采用Real-Time Crowdsourcing,即把当前的user input 输入到其他users,让其他users来回答,得到respose给当前的usr.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值