好消息,MinerU客户端、模型更新啦!飞一样的解析速度已经在社区里炸开了锅,快来看看,还有哪些新变化?是否有你期待已久的那一个
01 PDF一键转Docx、HTML、LaTex
新增3种导出格式,二次编辑更方便
MinerU 新版超给力!除了原本的Markdown、Json格式外,还支持Docx、HTML、LaTeX 格式一键导出!导出的文件能与WPS、浏览器、VSCode、Overleaf这些常用软件无缝衔接,不管是写论文、做报告、跨平台交互都能轻松搞定。彻底告别复杂PDF转格式乱码、排版错位的糟心事,让文档处理变得so easy。
02 截图一贴,局部内容秒提取
新增截图识别,支持公式、表格、文字自动解析
MinerU新上线的“随手一截,局部内容秒提取”功能,让你彻底告别PDF里敲文字、扒公式、抠表格的抓狂日常!想提取哪里就截哪里!同时支持本地图片批量上传解析,学生党做笔记、上班族整理资料,效率直接翻倍,让你收藏夹里的各类碎片信息、笔记截图再也不用吃灰啦,懒人必备技能 get✅
03 同屏联动预览,复制下载超灵活!
支持原文与解析内容联动阅读,提取内容可多格式复制、下载
PDF与解析内容对照阅读不方便?新版本支持原文和解析结果实时联动预览,同屏对比,哪里不对一眼锁定,校对效率直接拉满。
更实用的是,解析后的图片、表格、公式、文字元素全都能自由复制,并且支持多种格式下载,比如:公式想贴进论文?LaTeX、MathML 随便复制,还能下载高清 PNG 塞进 PPT!表格要加工?CSV、HTML、Markdown 格式任选,数据分析、网页排版都能无缝衔接…… 总之,你的整个文档内容,想怎么用就怎么用!
04 底层模型大升级:更快、更稳、更丝滑!
最新版1.3模型,本地安装兼容性、性能、易用性大幅优化
除了客户端功能更新外,MinerU 模型也迎来了重磅升级,最新的1.3系列升级了公式识别模型并优化其加载方式,使多行公式提取更精准、快速;同时提供多文件的batch处理脚本,支持批量小文件并行处理,大大提升解析速度;另外增加实时进度条显示,精准把握解析进度,让等待不再痛苦。
特别的是,此次针对 MinerU 模型本地部署效率进行了改进与升级,显著降低硬件门槛并优化多环境适配能力:
● 重点重构了框架兼容体系,全面支持Python 3.10-3.13版本、Torch 2.2-2.6系列(除2.5外)及多版本CUDA(11.8/12.4/12.6/12.8),更好地适配50系/H系等显卡类型。
● 在性能方面,显存占用压缩至最低仅需6GB,大幅拓宽了个人设备与轻量化部署场景的适用范围;同时针对Apple MPS设备深度优化推理速度,进一步释放硬件潜能;
● 引入paddleocr2torch技术方案,完全替代paddle框架以及paddleocr在项目中的使用,解决了paddle和torch的冲突问题,消除了多框架冲突风险与线程安全隐患;另外新版模型支持完全离线部署——所有模型文件均可预先集成,部署后无需任何网络依赖。