本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域,包括但不限于ChatGPT和Stable Diffusion等。我们将深入研究大型模型的开发和应用,以及与之相关的人工智能生成内容(AIGC)技术。通过深入的技术解析和实践经验分享,旨在帮助读者更好地理解和应用这些领域的最新进展
https://arxiv.org/pdf/2102.12128.pdf
从文档中抽取问答对任务,经典的做法是基于Pipline的方式。如上图(a)先从文档中抽取候选的答案,然后基于候选的答案生成合适的问题。上图(b)先基于文档生成问题,再基于生成的问题进行机器阅读理解,从文档中抽取答案
作者认为,高质量的问答对直接决定了下游任务的最终效果,从而极大的决定了用户体验。 但是目前产出问答对主要依赖于人工标注或用多个模型分别产生问题和答案。人工标注会涉及到数据隐私而且标注的成本较高而且拓展性较差难以大规模应