如何使用命令行从图像中提取文本

读取图像并自己提取文本非常容易。 但是动态地从照片中提取文本要困难一些,而且值得庆幸的是, imgclip提供了一个相当简单的解决方案。

命令行工具在Mac,Windows和Linux的终端中运行。 它只需要为图像文件加上语言作为参数,然后返回复制到剪贴板的文本即可。

您可以通过npm安装整个库,这是一个非常简单的安装 。 这个东西只有几KB大 ,并且带有一个JS文件,您可以在GitHub上浏览该文件。

Imgclip 使用Tesseract.js库来自动化图像处理并通过OCR提取文本。 它是迄今为止功能最强大的OCR库之一,并且像imgclip一样是完全开源的。

我觉得这个工具的质量和速度给我留下了最深刻的印象。 确实可以提取准确的文本 ,它是最简单的工具之一。

imgclip命令应直接在终端中运行 ,然后是图像的相对路径。 您还可以在末尾添加四个选项来自定义输出。

  1. -h ,-- --help输出用法信息
  2. -V--version version 输出版本号
  3. -l ,-- --lang输出图像中文本的语言
  4. -p--print打印出来的文字图像中(而不是复制到剪贴板)

在撰写本文时,Tesseract 支持65种语言,并且还在不断增加。 附加到--lang标记的代码应该是那些Tesseract文件中使用的代码。

例如, -l eng将在图像中搜索英文文本 ,而-l jpn将搜索日文文本 ,您甚至可以运行-l jpn_vert来搜索垂直方向的日文文本

由于imgclip严重依赖Tesseract,因此您基本上可以使用整个库的功能。

首先 ,请访问GitHub页面并在本地下载副本,或通过npm将其安装到特定目录。 然后,您可以像应用程序一样在终端中运行该工具来解析所需的任何图像

要查看imgclip的实际效果 ,请查看此简短视频该视频是作为imgclip演示创建的。

imgclip cli演示视频

翻译自: https://www.hongkiat.com/blog/extract-text-from-images-imgclip/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值