JavaScript识别图片文字

<!DOCTYPE html>
<html lang="en">

<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title>Document</title>
  <script src='https://unpkg.com/tesseract.js@v2.0.0-beta.1/dist/tesseract.min.js'></script>
</head>

<body>
  <img src="a1.png" id="img" style="width: 400px; height: auto;">
  <button onclick="start()">识别文字</button>
  <div id="content" contenteditable="true"></div>

  <input type="file" id="uploader">

  <script>
    async function start () {
      const img = document.getElementById('img')
      const content = document.getElementById('content')

      const { data: { text } } = await Tesseract.recognize(img, 'chi_sim', {
        langPath: '',
        logger: m => console.log(m),
      })
      content.innerText = text
    }

    // 获取文件上传输入框元素
    let uploader = document.getElementById("uploader")
    let file = ''
    // 绑定change事件监听器
    uploader.addEventListener("change", function (event) {
      // 获取所选择的文件
      file = event.target.files[0]
      // 在这里可以执行你希望处理的操作,比如读取文件内容、上传文件等
      recognize()
    })
    const recognize = async () => {
      const { data: { text } } = await Tesseract.recognize(file, 'chi_sim', {
        langPath: '',
        logger: m => console.log(m)
      })
      content.innerText = text
    }

  </script>
</body>

</html>

下载chi_sim.traineddata.gz,配置langPath:' ',访问速度会快

https://raw.githubusercontent.com/naptha/tessdata/gh-pages/4.0.0_fast/chi_sim.traineddata.gz

实现效果

  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值