[241003] GOT-OCR-2.0 正式开源！| Debian 包管理器：你需要知道的一切

x-cmd

于 2024-10-03 08:27:24 发布

阅读量868

点赞数 6

分类专栏： daily blog 文章标签： ocr debian 运维人工光学模型 apt linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/edwinjhlee/article/details/142688605

版权

目录

GOT-OCR-2.0 正式开源！

随着对人工光学字符智能处理需求的不断增长，传统 OCR 系统（OCR-1.0）已无法满足用户需求。本文将所有人工光信号（如纯文本、数学/分子式、表格、图表、乐谱甚至几何形状）统称为“字符”，并提出通用OCR理论及名为 GOT 的优秀模型，推动 OCR-2.0 时代的到来。

GOT 是一个拥有5.8亿参数的统一、优雅、端到端的模型，由高压缩编码器和长上下文解码器组成。作为 OCR-2.0 模型，GOT 能够处理上述所有“字符”的各种 OCR 任务。

OCR-2.0 model GOT 自 2024年9月3日发布并宣布正式开源，近期一直处于活跃状态。

GOT 模型特点：

开源友好： GOT 模型代码、权重和 benchmark 全部开源，方便开发者快速上手，进行研究和应用开发！
部署便捷： GOT 模型支持 Huggingface 部署，社区已实现 llama_cpp_inference 的第一个版本，让你轻松玩转 OCR！

GOT 模型发展历程：

2024年9月3日： GOT 模型代码、权重和 benchmark 正式开源，同时论文提交 Arxiv，标志着 OCR 2.0 时代的到来！
2024年9月13日： GOT 模型 Huggingface 部署上线，开发者可以更方便地体验 GOT 模型的强大性能！
2024年9月14日： GOT 模型官方 demo 正式发布，感谢 Huggingface 提供的 GPU 资源！
2024年9月23日： GOT 模型 Modelscope 官方 demo 发布，感谢 Modelscope 提供的 GPU 资源！
2024年9月24日： GOT 模型支持 ms-swift 快速微调，开发者可以使用自己的数据轻松定制模型！
2024年9月29日&#

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。