Zotero OCR 插件项目推荐
zotero-ocr Zotero Plugin for OCR 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-ocr
项目基础介绍和主要编程语言
Zotero OCR 是一个开源的 Zotero 插件,旨在为 Zotero 用户提供 PDF 文件的光学字符识别(OCR)功能。该项目由 UB-Mannheim 开发和维护,主要使用 JavaScript 编写,同时也包含部分 HTML、Shell 和 Fluent 语言的代码。
项目核心功能
Zotero OCR 插件的核心功能包括:
- PDF 文件的 OCR 处理:用户可以选择 Zotero 中的 PDF 文件进行 OCR 处理,识别并提取文本内容。
- 多种输出格式:插件支持生成包含识别文本的新 PDF 文件、仅包含识别文本的笔记文件,以及 HTML(hOCR)文件。
- 自定义配置:用户可以根据需要调整 OCR 引擎的路径、输出 DPI、Tesseract 页面分割模式(PSM)等参数。
- 兼容性:插件兼容 Zotero 6 和 Zotero 7,用户可以根据自己的 Zotero 版本进行配置和使用。
项目最近更新的功能
Zotero OCR 插件最近的更新包括:
- 版本 0.8.1:该版本于 2024 年 9 月 7 日发布,主要修复了一些已知问题,并改进了插件的稳定性和性能。
- 默认附件类型调整:从版本 0.8.0 开始,插件默认将新 PDF 文件作为普通附件添加,而不是链接文件,以避免在群组库中使用链接文件时的一些问题。
- 调试和错误报告:增加了更多的调试信息和错误报告功能,帮助用户和开发者更好地定位和解决问题。
通过这些更新,Zotero OCR 插件进一步提升了用户体验,使其在处理 PDF 文件的 OCR 任务时更加高效和可靠。
zotero-ocr Zotero Plugin for OCR 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-ocr