方案设计图示 query: 用户的提问passage: 文章 问答模型设计的是简单问题模型,即query的答案是从passage中抽取出的。query和passage经过数据预处理,得到id形式的输入,然后把query,passage的id形式输入到BERT模型,BERT模型经过处理会输出答案的位置,输出位置以后就可以得到相应的答案了。 数据集 使用的DuReader内置中文数据集,数据集形式: Question: 提问context: 提问对应的段落answer: 问题答案location: 答案在段落中开始的位置