ODQA 全称 Open Domain Question Answering,即开放域问答,是 NLP 领域长期研究的重要课题,在搜索引擎、智能客服、智能助手等行业应用广泛。
随着深度学习技术的发展,问答系统逐渐从基于特征的多模块级联系统,向更为精简高效的端到端训练转变。
基于神经搜索框架 Jina,百度 NLP 团队推出了领先的检索式端到端问答开发工具--RocketQA,进一步提升了 ODQA 系统的性能。
Jina:下一代开源神经搜索引擎
Jina 是一个神经搜索框架,目前已经在 GitHub 开源,适用于所有格式的数据类型。利用 Jina,用户可以在几分钟内构建 SOTA 和可扩展的深度学习搜索应用。
它具有以下优势:
节省时间:神经搜索系统的设计模式,支持 PyTorch/Keras/ONNX/Paddle,用户可以在几分钟内搭建解决方案。
支持所有数据类型:支持处理、索引、查询和理解视频、图像、长/短文本、音频、源代码、 pdf 等多种数据类型。
本地和云端友好:支持分布式架构、可扩展和云原生。
拥有自己的堆栈:保留解决方案的端到端堆栈所有权。规避多供应商、通用遗留工具等风险。
用 Jina 搭建 ODQA 系统,可参见:
https://