概述
本文将介绍本项目的核心架构及各模块的功能。
项目介绍
目的
本项目将开发一个用于基于文本内容的QA问答网站。不限制应用领域、不限制数据内容,支持用户自行上传文本内容并进行问答。
该项目可以抽象为四大系统:1、检索系统。2、问答系统。3、问题生成和管理系统。4、交互系统。
检索系统
该系统用于对文本文档进行索引构建并提供查询服务。特别的,对于该项目文档的本质是文段,我们需要借助系统对文段进行定位。该系统的输入包括查询query和查询上下文context(由交互系统生成),查询上下文用于辅助当前的查询,借助之前查询Q和A的匹配度来优化查询质量。
使用上下文信息有两种思路:
1、修改Lucene的检索源码,加入上下文信息的检索机制。