eSearch项目14.7.0版本发布:OCR模型重大升级与功能优化
项目简介
eSearch是一款开源的跨平台桌面应用,主要提供OCR文字识别、屏幕截图、录屏等功能。作为一个功能强大的工具集,它能够帮助用户快速从图像或视频中提取文字内容,并进行后续的编辑和处理。本次14.7.0版本的发布带来了OCR核心功能的重大升级,以及多项用户体验的优化。
OCR模型重大升级
本次版本最显著的改进是对OCR识别模型的全面升级。开发团队将原有的paddleocr rec v4移动端模型替换为服务端模型,这一变化带来了显著的识别能力提升:
-
字符集覆盖大幅扩展:新模型支持超过1.5万个字符的识别,包括各种生僻字、日文字符以及表情符号等。这对于需要处理多语言混合内容或特殊字符的用户来说是一个重大利好。
-
模型体积变化:由于采用了更强大的服务端模型,识别模型的大小从原来的约10MB增加到约90MB。虽然体积增大,但带来的准确率提升是显著的。
-
技术架构调整:在底层实现上,移除了对OpenCV的依赖,转而使用Canvas API进行图像处理,这有助于提高跨平台的兼容性和性能表现。
值得注意的是,虽然新模型性能更强,但用户仍然可以手动下载并使用之前的轻量级模型,以满足不同场景下的需求。对于支持GPU加速的设备,配合GPU后端使用将获得更好的性能体验。
设置功能优化
在设置方面,14.7.0版本进行了多项改进:
-
OCR模型管理:现在用户可以更方便地管理离线OCR模型,包括移除模型(但保留下载的文件)的功能。这为需要临时释放空间或测试不同模型的用户提供了灵活性。
-
模型路径配置:新增了显式配置模型位置的选项,让高级用户能够更精确地控制模型的存储和使用位置。
-
交互优化:将下载模型按钮整合到添加模型弹窗中,简化了操作流程,使界面更加整洁直观。
录屏功能修复
针对录屏功能,修复了一个关于系统音频设置记忆的问题。现在软件能够正确记住用户上次使用时是否开启了系统音频录制,避免了每次都需要重新设置的麻烦。
主页面改进
在主页面功能方面,本次更新主要优化了文本处理的相关功能:
-
文本自动处理:新增了自动删除换行和连字符的功能,使得从OCR识别结果中提取的文本更加整洁,减少了后期编辑的工作量。
-
校对功能修复:修复了在校对功能复用后AI校对缓存未清空的问题,确保了校对结果的准确性。
跨平台支持
eSearch继续保持其优秀的跨平台特性,为Windows、macOS和Linux三大主流操作系统提供了完整的支持。每个平台都提供了多种格式的安装包,包括:
- Windows:exe和zip格式
- macOS:dmg和zip格式
- Linux:AppImage、deb、rpm和tar.gz格式
同时支持x64和arm64架构,确保在不同硬件平台上都能获得良好的使用体验。
总结
eSearch 14.7.0版本通过升级OCR模型显著提升了文字识别的准确率和字符覆盖范围,同时优化了多项功能的用户体验。特别是对于需要处理多语言、特殊字符内容的用户,这一版本将带来实质性的效率提升。设置功能的改进使得软件更加易用,而跨平台的完整支持则确保了不同操作系统用户都能获得一致的良好体验。
对于现有用户,建议关注OCR模型变化带来的性能影响,根据自身设备条件选择合适的后端配置。新用户则可以体验到更强大的开箱即用识别能力。整体而言,这是一个注重核心功能提升和质量改进的版本。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考