
OCR专栏
文章平均质量分 91
OCR专栏
双木的木
种一棵树最好的时间是十年前,其次是现在。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
信息化与数字化 | 万字长文:OCR/多模态大模型评测体系全景
本文将系统梳理当前主流的多模态评测基准,包括 OCRBench v2、SEED-Bench-2-Plus、ConTextual、Fox、TableVQA-Bench、ComTQA、MMTab-eval、ChartY、ChartX、MMC、CC-OCR、Video-MME、MME、BLINK、ChEF、GenCeption、DesignQA、MMT-Bench与Omni AI OCR Benchmark 等,通过对其提出背景、作者机构、任务设计、评估指标、模型适用性等方面进行分析比较,帮助读者全面理解当前多模原创 2025-05-21 14:37:08 · 1392 阅读 · 0 评论 -
机器学习与数学 | 本地部署大模型实现扫描版 PDF 文件 OCR 识别,笔记本可跑
在使用大模型处理书籍 PDF 时,有时你会遇到扫描版 PDF,也就是说每一页其实是图像形式。这时,大模型需要先从图片中提取文本,而这就需要借助 OCR(光学字符识别)技术。原创 2025-05-11 11:03:46 · 1023 阅读 · 0 评论 -
OpenCV与AI深度学习 | Ollama-OCR:现在可作为 Python 包使用!
对于开发人员和 OCR 爱好者来说是个好消息——Ollama -OCR现已作为 Python 包提供!🎉此次更新使将Ollama-OCR集成到您现有的应用程序、工作流程或自动化脚本中变得比以往更加容易。只需几行代码,您现在就可以直接在 Python 中利用最先进的 OCR 功能。原创 2025-01-03 17:56:45 · 1235 阅读 · 0 评论 -
大数据与人工智能Lab | 【附论文】白话文本检测经典模型:CTPN
文字识别是AI的一项重要应用,例如将包装盒上的文字识别出来、将产品说明书上的文字识别出来、将大街上广告牌的文字识别出来等等,在现实生活中能给我们带来很大的便利,有着非常广泛的应用。原创 2024-11-15 17:41:09 · 1053 阅读 · 0 评论 -
OpenCV与AI深度学习 | PaddleOCR 2.9 发布, 正式开源文本图像智能分析利器
飞桨低代码开发工具 PaddleX,依托于 PaddleOCR 的先进技术,支持了 OCR 领域的低代码全流程开发能力。通过低代码全流程开发,可实现简单且高效的模型使用、组合与定制。这将显著减少模型开发的时间消耗,降低其开发难度,大大加快模型在行业中的应用和推广速度。原创 2024-10-19 17:27:30 · 1384 阅读 · 1 评论 -
python | easyocr,一个超厉害的 关于OCR的 Python 库!
EasyOCR库是一个功能强大且易于使用的 OCR 工具,能够帮助开发者在各种应用场景中高效地提取图片中的文字。通过支持多语言、高效识别、手写文字识别和自定义模型,EasyOCR提供了强大的功能和灵活的扩展能力。本文详细介绍了EasyOCR库的安装方法、主要特性、基本和高级功能,以及实际应用场景。希望本文能帮助大家全面掌握EasyOCR库的使用,并在实际项目中发挥其优势。无论是在文档数字化、数据录入自动化还是图像文字翻译中,EasyOCR库都将是一个得力的工具。原创 2024-07-24 17:54:15 · 3385 阅读 · 3 评论