Android 开发 OCR 拍照 + ML Kit 识别文字 巨详细全部代码教程

效果图

  • 流程:点击拍照,调取设备相机拍照,获取图片显示到页面,提取照片内的文字
    在这里插入图片描述

一、OCR的含义

ocr是Optical Character Recognition(光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程

二、什么是ML Kit

ML Kit是一个由Google开发的跨平台移动SDK(Android和iOS)。它带来了谷歌的端上机器学习能力。
ML Kit所有在端上运行的API允许实时和离线功能。这也意味着这些功能在离线模式下也可用。

ML Kit可以识别超过100种语言的文本,包括原生拼写及罗马转写系统,比如汉语、俄语、印地语、英语、希腊语等。点击查看支持语言的完整列表

三、官网步骤教程

  • 本文跟着官网教程走,如下图:
    在这里插入图片描述

1、添加依赖

注意此 API 需要 Android API 级别 21 或更高版本。确保应用的 build file 使用值 21 或更高。minSdkVersion

  • 在项目级文件中,请确保在 your 和 sections 中都包含 GoogleMaven 存储库。build.gradlebuildscriptallprojects
  • 将 ML Kit Android 库的依赖项添加到模块的应用级 gradle 文件,该文件通常为:app/build.gradle

本文讲的是中文识别,所以只导入了中文依赖包,你可以根据自己所需选择导入的依赖包

 // To recognize Chinese script
  implementation 'com.google.mlkit:text-recognition-chinese:16.0.0'

在这里插入图片描述

2、创建TextRecognizer

因为本文是中文,所以使用的中文脚本库

 ChineseTextRecognizerOptions build = new ChineseTextRecognizerOptions.Builder().build();
 TextRecognizer recognizer = TextRecognition.getClient(build);

在这里插入图片描述

3、输入图像

图像来源有:

  • 使用media.Image
  • 使用文件 URI
  • 使用 或ByteBufferByteArray
  • 使用Bitmap

本文用的是使用Bitmap,如下图

InputImage image = InputImage.fromBitmap(bitmap, 0);

在这里插入图片描述

4、处理图像

将图像传递给方法:process

 recognizer.process(image)
                .addOnSuccessListener(new OnSuccessListener<Text>() {
                    @Override
                    public void onSuccess(Text visionText) {
                        // Task completed successfully
                        // ...
                    }
                })
                .addOnFailureListener(
                        new OnFailureListener() {
                            @Override
                            public void onFailure(@NonNull Exception e) {
                                // Task failed with an exception
                                // ...
                            }
                        });

在这里插入图片描述

四、实际代码案例Demo如下:

别忘了导入依赖包!!!

1、Main.xml

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
    xmlns:app="http://schemas.android.com/apk/res-auto"
    xmlns:tools="http://schemas.android.com/tools"
    android:layout_width="match_parent"
    android:layout_height="match_parent"
    android:orientation="vertical"
    tools:context=".MainActivity">
    <Button
        android:id="@+id/btn"
        android:text="拍照"
        android:layout_width="wrap_content"
        android:layout_height="wrap_content"/>
    <ImageView
        android:id="@+id/image"
        android:layout_width="wrap_content"
        android:layout_height="wrap_content"/>
    <TextView
        android:id="@+id/tv_result"
        android:layout_width="wrap_content"
        android:layout_height="wrap_content"/>

</LinearLayout>

1、Main.java

package com.example.mlkitapplication;

import androidx.annotation.NonNull;
import androidx.appcompat.app.AppCompatActivity;
import androidx.core.app.ActivityCompat;
import androidx.core.content.ContextCompat;

import android.Manifest;
import android.annotation.SuppressLint;
import android.content.Intent;
import android.content.pm.PackageManager;
import android.graphics.Bitmap;
import android.os.Bundle;
import android.provider.MediaStore;
import android.view.View;
import android.widget.Button;
import android.widget.ImageView;
import android.widget.TextView;

import com.google.android.gms.tasks.OnFailureListener;
import com.google.android.gms.tasks.OnSuccessListener;
import com.google.mlkit.vision.common.InputImage;
import com.google.mlkit.vision.text.Text;
import com.google.mlkit.vision.text.TextRecognition;
import com.google.mlkit.vision.text.TextRecognizer;
import com.google.mlkit.vision.text.chinese.ChineseTextRecognizerOptions;

public class MainActivity extends AppCompatActivity {

    private static final int REQUEST_CAMERA_PERMISSION = 1;
    private static final int REQUEST_IMAGE_CAPTURE = 1;
    private TextView tv_result;
    private ImageView image;
    @SuppressLint("MissingInflatedId")
    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);
        tv_result=findViewById(R.id.tv_result);
        image=findViewById(R.id.image);
        //权限检查
        requestCameraPermission();
        @SuppressLint({"MissingInflatedId", "LocalSuppress"}) Button btn=findViewById(R.id.btn);
        btn.setOnClickListener(new View.OnClickListener() {
            @Override
            public void onClick(View view) {
                dispatchTakePictureIntent();//调本地相机
            }
        });
    }

    private void dispatchTakePictureIntent() {
        Intent takePictureIntent = new Intent(MediaStore.ACTION_IMAGE_CAPTURE);
        if (takePictureIntent.resolveActivity(getPackageManager()) != null) {
            startActivityForResult(takePictureIntent, REQUEST_IMAGE_CAPTURE);
        }
    }

    private void requestCameraPermission() {
        if (ContextCompat.checkSelfPermission(this, Manifest.permission.CAMERA)
                != PackageManager.PERMISSION_GRANTED) {
            ActivityCompat.requestPermissions(this,
                    new String[]{Manifest.permission.CAMERA},
                    REQUEST_CAMERA_PERMISSION);
        }
    }


    @Override
    protected void onActivityResult(int requestCode, int resultCode, Intent data) {
        super.onActivityResult(requestCode, resultCode, data);
        if (requestCode == REQUEST_IMAGE_CAPTURE && resultCode == RESULT_OK) {
            Bundle extras = data.getExtras();
            Bitmap imageBitmap = (Bitmap) extras.get("data");
            image.setImageBitmap(imageBitmap);
            // 在这里使用imageBitmap进行文字识别
            recognizeTextFromBitmap(imageBitmap);
        }
    }

    private void recognizeTextFromBitmap(Bitmap bitmap) {
        InputImage image = InputImage.fromBitmap(bitmap, 0);
        ChineseTextRecognizerOptions build = new ChineseTextRecognizerOptions.Builder().build();
        TextRecognizer recognizer = TextRecognition.getClient(build);
        recognizer.process(image)
                .addOnSuccessListener(new OnSuccessListener<Text>() {
                    @Override
                    public void onSuccess(com.google.mlkit.vision.text.Text text) {
                        String text1 = text.getText();
                        tv_result.setText(text1);
                        recognizer.close();
                    }
                })
                .addOnFailureListener(new OnFailureListener() {
                    @Override
                    public void onFailure(@NonNull Exception e) {
                        // 处理错误
                        e.printStackTrace();
                        // 释放资源
                        recognizer.close();
                    }
                });
    }
}
  • 8
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Android OCR文字识别可以通过使用Tesseract OCR库来实现。以下是实现OCR文字识别的步骤: 1. 在build.gradle文件中添加以下依赖项: ```gradle implementation 'com.rmtheis:tess-two:9.0.0' ``` 2. 将训练数据文件夹(tessdata)复制到项目的assets文件夹中。 3. 在MainActivity.java文件中添加以下代码: ```java // 导入Tesseract OCR库 import com.googlecode.tesseract.android.TessBaseAPI; public class MainActivity extends AppCompatActivity { // 声明OCR引擎 private TessBaseAPI mTess; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_main); // 初始化OCR引擎 mTess = new TessBaseAPI(); String datapath = getFilesDir() + "/tesseract/"; String language = "eng"; mTess.init(datapath, language); // 获取ImageView、Button和TextView控件 ImageView imageView = findViewById(R.id.imgv); Button button = findViewById(R.id.btnOcr); TextView textView = findViewById(R.id.tvshow); // 设置Button的点击事件 button.setOnClickListener(new View.OnClickListener() { @Override public void onClick(View v) { // 获取ImageView中的Bitmap对象 Bitmap bitmap = ((BitmapDrawable)imageView.getDrawable()).getBitmap(); // 将Bitmap对象传递给OCR引擎进行文字识别 mTess.setImage(bitmap); String result = mTess.getUTF8Text().replace(" ", "").toLowerCase(); // 将识别结果显示在TextView中 textView.setText(result); } }); } @Override protected void onDestroy() { super.onDestroy(); // 释放OCR引擎 mTess.end(); } } ``` 4. 在布局文件中添加一个ImageView、一个Button和一个TextView控件。 ```xml <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" android:orientation="vertical" android:layout_width="match_parent" android:layout_height="match_parent"> <ImageView android:layout_width="match_parent" android:layout_height="300dp" android:id="@+id/imgv"/> <Button android:layout_width="wrap_content" android:layout_height="wrap_content" android:id="@+id/btnOcr" android:text="识别"/> <TextView android:layout_width="wrap_content" android:layout_height="wrap_content" android:text="Hello World!" android:id="@+id/tvshow" /> </LinearLayout> ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AaVictory.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值