由360人工智能研究院知识图谱&文档理解团队(https://github.com/360AILAB-NLP)开源的多场景轻量化版式分析模型360LayoutAnalysis开源啦!欢迎下载使用。
主要特点:
1)涵盖中文论文、英文论文、中文研报三个垂直领域及1个通用场景模型;
2)轻量化推理快速【基于yolov8训练,单模型6.23MB】;
3)中文论文场景包含段落信息【CLDA不具备段落信息,我们开源独有】;
4)中文研报场景/通用场景【基于数万级别高质量数据训练,我们开源独有】
Github地址:
https://github.com/360AILAB-NLP/360LayoutAnalysis
模型权重-huggingface地址:
https://huggingface.co/qihoo360/360LayoutAnalysis
一、为什么要做这个事情
在数字化以及文档处理场景下,总会涉及到技术设计的方案,一般可以总结成如下三种路线: