聊天机器人是非常常见而广泛的应用,很多企业都有很多机器人客服的需求,比如:移动、电信、联通、淘宝、京东等等,聊天机器人的本质就是文本数据处理,我的主要研究方向并不是文本处理相关的,但是断断续续学习、工作中接触到了一定的文本数据处理的任务,对文本数据处理也算得上是有一定的了解程度吧。
聊天机器人的应用可以简单理解为“输入一句话,机器返回一句响应的话”,返回的话跟你的话或者是问题相关度比较高,让你察觉不到是在跟一台机器聊天,这里模型需要能够比较确切地了解或者是解读清楚你输入的文本数据,然后才能返回对应的回答信息,这里我们采用的是比较经典的seq2seq模型来实现这一应用。
首先来看一下我们准备好的语料对数据集,这里的数据集都是成对出现的,如下所示:
学过高数妈 不管你信不信,反正我不想回答你
可惜不是女神 消失在人海
耍一个看看咯 恩打嘛打嘛
嗯嗯,唏溜唏溜~主人 哦哦哦哦
你有英文名吗 马能一次小燕,这是英文,看不懂就算了face57
在干嘛,吃饭了吗 我吃电的哦
鬼斧神工 麻麻呀...又来一个说瞎话的
那你给我买包子吃吗 当然!必须的!
问你句话,沙浪利索艮揪的,啥意思 爱过
我早知道了 那你怎么不早说
是个给 嘿嘿
那你是男的 要检查下么?走,进房