Tesseract参数详解

C:\Users\jack>tesseract --help-extra

Usage:
  tesseract --help | --help-extra | --help-psm | --help-oem | --version
  tesseract --list-langs [--tessdata-dir PATH]
  tesseract --print-parameters [options...] [configfile...]
  tesseract imagename|imagelist|stdin outputbase|stdout [options...] [configfile...]

OCR options:
  --tessdata-dir PATH   Specify the location of tessdata path.
  --user-words PATH     Specify the location of user words file.
  --user-patterns PATH  Specify the location of user patterns file.
  --dpi VALUE           Specify DPI for input image.
  -l LANG[+LANG]        Specify language(s) used for OCR.
  -c VAR=VALUE          Set value for config variables.
                        Multiple -c arguments are allowed.
  --psm NUM             Specify page segmentation mode.
  --oem NUM             Specify OCR Engine mode.
NOTE: These options must occur before any configfile.

Page segmentation modes:
  0    Orientation and script detection (OSD) only.
  1    Automatic page segmentation with OSD.
  2    Automatic page segmentation, but no OSD, or OCR. (not implemented)
  3    Fully automatic page segmentation, but no OSD. (Default)
  4    Assume a single column of text of variable sizes.
  5    Assume a single uniform block of vertically aligned text.
  6    Assume a single uniform block of text.
  7    Treat the image as a single text line.
  8    Treat the image as a single word.
  9    Treat the image as a single word in a circle.
 10    Treat the image as a single character.
 11    Sparse text. Find as much text as possible in no particular order.
 12    Sparse text with OSD.
 13    Raw line. Treat the image as a single text line,
       bypassing hacks that are Tesseract-specific.

OCR Engine modes:
  0    Legacy engine only.
  1    Neural nets LSTM engine only.
  2    Legacy + LSTM engines.
  3    Default, based on what is available.

Single options:
  -h, --help            Show minimal help message.
  --help-extra          Show extra help for advanced users.
  --help-psm            Show page segmentation modes.
  --help-oem            Show OCR Engine modes.
  -v, --version         Show version information.
  --list-langs          List available languages for tesseract engine.
  --print-parameters    Print tesseract parameters.
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Tesseract.js是一个基于Google开发的OCR引擎Tesseract的JavaScript库,可以在浏览器和Node.js环境中使用。React是一个由Facebook开发的用于构建用户界面的JavaScript库。在React应用程序中使用Tesseract.js可以使您的应用程序具有识别图像文本的能力。 以下是使用Tesseract.js在React应用程序中识别图像文本的详细步骤: 1. 首先,您需要安装Tesseract.js库。在您的React应用程序中,可以使用npm或yarn进行安装。使用以下命令进行安装: ``` npm install tesseract.js ``` 2. 接下来,您需要导入Tesseract.js库。您可以使用以下代码将其导入到React组件中: ```javascript import Tesseract from 'tesseract.js'; ``` 3. 然后,您需要创建一个函数,该函数将处理图像并将其传递给Tesseract.js以进行文本识别。您可以使用以下代码创建一个名为recognizeText的函数: ```javascript const recognizeText = async (image) => { const result = await Tesseract.recognize(image, 'eng'); return result.data.text; }; ``` 在上面的代码中,我们将image和'eng'作为参数传递给Tesseract.recognize()方法。image参数是要识别的图像,'eng'参数是要使用的语言。您可以根据需要更改这些参数。 4. 接下来,您需要在React组件中使用recognizeText函数。您可以在React组件的事件处理程序中使用它。例如,以下是一个名为handleImageUpload的事件处理程序,该处理程序将在选择图像时调用recognizeText函数并将结果存储在React状态中: ```javascript handleImageUpload = async (event) => { const file = event.target.files[0]; const reader = new FileReader(); reader.onloadend = async () => { const image = new Image(); image.src = reader.result; image.onload = async () => { const result = await recognizeText(image); this.setState({ text: result }); }; }; reader.readAsDataURL(file); }; ``` 在上面的代码中,我们使用FileReader读取选定的图像文件。然后,我们创建一个新的Image对象,并将其设置为从文件读取的结果。最后,我们在图像加载完成后调用recognizeText函数,并将结果存储在React状态中。 5. 最后,您可以在React组件的render方法中使用识别的文本。例如,以下是一个简单的render方法,该方法将识别的文本显示在屏幕上: ```javascript render() { return ( <div> <input type="file" onChange={this.handleImageUpload} /> <p>{this.state.text}</p> </div> ); } ``` 在上面的代码中,我们将handleImageUpload事件处理程序分配给文件上传输入。然后,我们使用this.state.text显示识别的文本。 这就是在React应用程序中使用Tesseract.js识别图像文本的基本步骤。您可以根据需要自定义这些代码以满足您的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值