对话由问题和回答组成,首先判断客服问题和用户回答是否契合,然后抽取必要的实体。
客服: 请问您是张麻子本人吗, Self_Confirm
用户: 是的, Valid, Confirm
客服: 请问您是想去大连旅游吗, Tour
用户: 手机号尾号是4123, Invalid, Phone
客服: 请问手机号尾号是多少, TAIL
用户: 手机号尾号是4123, Invalid, Phone
问题识别
分类问题
分析问题属于那个问题(类别)
比如“ 请问您是张麻子本人吗”属于Self_Confirm问题
问答匹配
分类问题
判断回答是否问题可接受的回答(Valid/Invalid)
采用bert的sentenceA + SentenceB方案
SentenceA为提问,SentenceB为回答
如果类别为Valid则通过,否则Invalid则不通过
回答抽取
阅读理解问题
针对给定问题,有目标的提取NER
如针对客服问题TAIL(请问手机号尾号是多少),从回答(手机号尾号是4123)提取手机尾号4123