系列文章:
国产PDF智能提取神器:MinerU功能全解析
正文:
2024年7月,上海人工智能实验室OpenDataLab团队正式推出了智能数据提取工具——MinerU。具备将混合图片、公式、表格、脚注等在内的复杂多模态 PDF 文档转化为Markdown格式的能力,可大幅提升AI语料的准备效率。凭借快速准确、开源易用的能力特性,MinerU受到广大用户及大模型开发者青睐, 上线五个月,GitHub星标数已接近2.5万,被开发者誉为“大模型时代的文档提取、转换神器”。
2025年1月,MinerU迎来新年更新,本次亮点一览:
● 客户端上线,下载即用,无需编程,无需登录,简单拖拽操作即可快速完成多文档提取
● 在线API接口服务、在线demo对齐最新模型能力,优化资源调度策略,全面增强批量处理能力
● MinerU品牌视觉焕新升级,网站全新上线,技术解读与功能文档一站式便捷获取
MinerU官网: https://mineru.net/
MinerU代码地址: https://github.com/opendatalab/MinerU
MinerU 线上demo入口: https://mineru.net/Ope