截屏、文字提取一气呵成,超实用OCR开源小工具

TextShot 是一个开源的 OCR 工具,可在屏幕上画矩形截取文字,支持多种语言。使用 AutoHotkey 可设置快捷键,Ubuntu 用户可在键盘设置中添加快捷方式。依赖于 Tesseract OCR 引擎,Tesseract 是一款历史悠久且功能强大的 OCR 工具,支持多种语言和输出格式。对于中文 OCR,推荐使用 chineseocr_lite,一个轻量级的中文字符识别项目。
摘要由CSDN通过智能技术生成

项目链接:https://github.com/ianzhao05/textshot

使用方法

运行 textshot.py,在屏幕上打开一个 overlay,在你希望提取的文字区域画一个矩形。

使用可选的命令行参数指定语言。例如,python textshot.py eng + fra 将使用英语作为主要语言,使用法语作为次要语言。默认值为英语(eng)。同时确保为其他语言安装了适用于 Tesseract 的数据文件。

建议将热键附加到此工具上。对于 Windows 来说,可以使用 AutoHotkey 脚本来完成此操作;textshot.ahk 同时也包含一个可以使用的示例 AHK 脚本。

如果是 Ubuntu 系统,可以打开「键盘设置」,其中显示了所有 Gnome 快捷方式。底部有一个「+」按钮,可用于添加你自己的快捷方式。单击并将其命令设置为 / usr / bin / python3 。如果使用的是 venv,则上面的 python3 路径应指向 venv 的 python3 而不是全局 python3。

 

部分代码展示

如何安装

安装 Python 3;

复制 TextShot 库,并使用跳转命令 cd 进入该库;

(可选项)创建一个虚拟环境,例如使用 python -m venv .venv ;

使用 pip install -r requirements.txt 安装所需的软件包;

安装 Google 的 Tesseract OCR 引擎(https://github.com/tesseract-ocr/tesseract),并通过将目录添加到系统路径来确保可以从命令行访问 tesseract

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值