项目中使用ocr技术进行识别图片中的文字,并展示在页面上。前端操作的话,第一次会超级无敌的慢。
首先需要下载一个插件并在使用的页面进行引入使用这个插件
npm i tesseract.js
有两种方式可以实现,一种是worker线程来实现,另一种使用js线程
import { createWorker } from 'tesseract.js' //【法一】worker多线程引入这个
或
import Tesseract from 'tesseract.js' //【法二】js单线程引入这个
获取到上传的图片并保存图片的路径,进行使用js线程识别或者worker线程识别。具体代码如下:
<template>
<div class="test">
<el-upload
accept=".png,.jpg,.jpeg,.doc,.docx,.txt,.xls,.xlsx"
ref="videoUpload"
class="upload-demo"
action="#"
:on-remove="handleRemove"
:limit="1"
drag
:on-change="handleChange"
:auto-upload="false"
:on-exceed="hand