Android 百度文字识别(详细步骤+源码)

/**

  • 通用文字识别

  • @param view

*/

public void generalBasic(View view) {

}

然后创建一个成员变量

/**

  • 通用文字识别请求码

*/

private static final int REQUEST_CODE_GENERAL_BASIC = 100;

创建获取保存文件的方法和Toast提示的方法

/**

  • Toast提示

  • @param msg

*/

private void showMsg(String msg) {

Toast.makeText(this,msg,Toast.LENGTH_SHORT).show();

}

/**

  • 获取保存文件

  • @param context

  • @return

*/

public static File getSaveFile(Context context) {

File file = new File(context.getFilesDir(), “pic.jpg”);

return file;

}

点击按钮时调用generalBasic

/**

  • 通用文字识别

  • @param view

*/

public void generalBasic(View view) {

Intent intent = new Intent(MainActivity.this, CameraActivity.class);

//传入文件保存的路径

intent.putExtra(CameraActivity.KEY_OUTPUT_FILE_PATH, getSaveFile(getApplication()).getAbsolutePath());

//传入文件类型

intent.putExtra(CameraActivity.KEY_CONTENT_TYPE, CameraActivity.CONTENT_TYPE_GENERAL);

//跳转页面时传递请求码,返回时根据请求码判断获取识别的数据。

startActivityForResult(intent, REQUEST_CODE_GENERAL_BASIC);

}

在com.llw.textocr包下新建一个RecognizeService类

代码如下

/*

  • Copyright © 2017 Baidu, Inc. All Rights Reserved.

*/

package com.llw.textocr;

import android.content.Context;

import com.baidu.ocr.sdk.OCR;

import com.baidu.ocr.sdk.OnResultListener;

import com.baidu.ocr.sdk.exception.OCRError;

import com.baidu.ocr.sdk.model.BankCardParams;

import com.baidu.ocr.sdk.model.BankCardResult;

import com.baidu.ocr.sdk.model.GeneralBasicParams;

import com.baidu.ocr.sdk.model.GeneralParams;

import com.baidu.ocr.sdk.model.GeneralResult;

import com.baidu.ocr.sdk.model.OcrRequestParams;

import com.baidu.ocr.sdk.model.OcrResponseResult;

import com.baidu.ocr.sdk.model.Word;

import com.baidu.ocr.sdk.model.WordSimple;

import java.io.File;

/**

  • Created by ruanshimin on 2017/4/20.

*/

public class RecognizeService {

interface ServiceListener {

public void onResult(String result);

}

public static void recGeneral(Context ctx, String filePath, final ServiceListener listener) {

GeneralParams param = new GeneralParams();

param.setDetectDirection(true);

param.setVertexesLocation(true);

param.setRecognizeGranularity(GeneralParams.GRANULARITY_SMALL);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeGeneral(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

Word word = (Word) wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recAccurate(Context ctx, String filePath, final ServiceListener listener) {

GeneralParams param = new GeneralParams();

param.setDetectDirection(true);

param.setVertexesLocation(true);

param.setRecognizeGranularity(GeneralParams.GRANULARITY_SMALL);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeAccurate(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

Word word = (Word) wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recAccurateBasic(Context ctx, String filePath, final ServiceListener listener) {

GeneralParams param = new GeneralParams();

param.setDetectDirection(true);

param.setVertexesLocation(true);

param.setRecognizeGranularity(GeneralParams.GRANULARITY_SMALL);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeAccurateBasic(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

WordSimple word = wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recGeneralBasic(Context ctx, String filePath, final ServiceListener listener) {

GeneralBasicParams param = new GeneralBasicParams();

param.setDetectDirection(true);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeGeneralBasic(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

WordSimple word = wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recGeneralEnhanced(Context ctx, String filePath, final ServiceListener listener) {

GeneralBasicParams param = new GeneralBasicParams();

param.setDetectDirection(true);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeGeneralEnhanced(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

WordSimple word = wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recWebimage(Context ctx, String filePath, final ServiceListener listener) {

GeneralBasicParams param = new GeneralBasicParams();

param.setDetectDirection(true);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeWebimage(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

WordSimple word = wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recBankCard(Context ctx, String filePath, final ServiceListener listener) {

BankCardParams param = new BankCardParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeBankCard(param, new OnResultListener() {

@Override

public void onResult(BankCardResult result) {

String res = String.format(“卡号:%s\n类型:%s\n发卡行:%s”,

result.getBankCardNumber(),

result.getBankCardType().name(),

result.getBankName());

listener.onResult(res);

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recVehicleLicense(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeVehicleLicense(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recDrivingLicense(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeDrivingLicense(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recLicensePlate(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeLicensePlate(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recBusinessLicense(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeBusinessLicense(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recReceipt(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

param.putParam(“detect_direction”, “true”);

OCR.getInstance(ctx).recognizeReceipt(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recPassport(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizePassport(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recVatInvoice(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeVatInvoice(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recQrcode(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeQrcode(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recNumbers(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeNumbers(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recLottery(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeLottery(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recBusinessCard(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeBusinessCard(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recHandwriting(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeHandwriting(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recCustom(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.putParam(“templateSign”, “”);

param.putParam(“classifierId”, 0);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeCustom(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

}

这是百度开发人员写的一个工具类,用来处理返回的数据的。

然后在MainActivity中重写onActivityResult方法。

/**

  • Activity回调

  • @param requestCode

  • @param resultCode

  • @param data

*/

@Override

protected void onActivityResult(int requestCode, int resultCode, @Nullable Intent data) {

super.onActivityResult(requestCode, resultCode, data);

// 识别成功回调,通用文字识别

if (requestCode == REQUEST_CODE_GENERAL_BASIC && resultCode == Activity.RESULT_OK) {

RecognizeService.recGeneralBasic(this, getSaveFile(getApplicationContext()).getAbsolutePath(),

new RecognizeService.ServiceListener() {

@Override

public void onResult(String result) {

showMsg(result);

Log.d(“result–>”,result);

}

});

}

}

返回时根据传递文件路径进行解析,这里解析的是一个图片,因为跳转的是一个相机Actiivty,拍照之后进行内容区域选取,然后返回。现在运行,你就会发现又报错了,这是改变了ocr_ui模块的gradle版本造成的。

import android.support.annotation.NonNull;

import android.support.v4.app.ActivityCompat;

import android.support.annotation.IntDef;

这两个包没有了,需要改变为androidx下的。

import androidx.annotation.NonNull;

import androidx.core.app.ActivityCompat;

import androidx.annotation.IntDef;

这个要改的类比较多,慢慢改就好了,都改好之后再运行。

在这里插入图片描述

日志如下:

在这里插入图片描述

OK,就这么愉快而又简单的完成了。

六、高精度文字识别


通过之前的操作已经可以简单是识别拍照的文字,但是还不够,原因有两点,第一就是识别不准确,第二是返回的数据不够简洁。下面就来解决这两个点。

打开activity_main.xml,在里面增加一个按钮。

<Button

android:id=“@+id/high_precision_button”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”

android:onClick=“highPrecision”

android:text=“通用文字识别(高精度)” />

然后进入到MainActivity中。

/**

  • 通用文字识别(高精度)请求码

*/

private static final int REQUEST_CODE_ACCURATE_BASIC = 101;

/**

  • 弹窗

*/

private AlertDialog.Builder mDialog;

在onCreate中

在这里插入图片描述

然后创建一个highPrecision方法

/**

  • 通用文字识别 (高精度版)

  • @param view

*/

public void highPrecision(View view) {

Intent intent = new Intent(MainActivity.this, CameraActivity.class);

intent.putExtra(CameraActivity.KEY_OUTPUT_FILE_PATH, getSaveFile(getApplication()).getAbsolutePath());

intent.putExtra(CameraActivity.KEY_CONTENT_TYPE, CameraActivity.CONTENT_TYPE_GENERAL);

startActivityForResult(intent, REQUEST_CODE_ACCURATE_BASIC);

}

高精度和普通的区别就在于不同的请求码,而关键就在于返回的处理上。

在onActivityResult中

// 识别成功回调,通用文字识别(高精度版)

if (requestCode == REQUEST_CODE_ACCURATE_BASIC && resultCode == Activity.RESULT_OK) {

RecognizeService.recAccurateBasic(this, getSaveFile(getApplicationContext()).getAbsolutePath(),

new RecognizeService.ServiceListener() {

@Override

public void onResult(String result) {

//弹窗显示识别内容

showDialog(result);

Log.d(“result–>”, result);

}

});

}

如何做好面试突击,规划学习方向?

面试题集可以帮助你查漏补缺,有方向有针对性的学习,为之后进大厂做准备。但是如果你仅仅是看一遍,而不去学习和深究。那么这份面试题对你的帮助会很有限。最终还是要靠资深技术水平说话。

网上学习 Android的资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。建议先制定学习计划,根据学习计划把知识点关联起来,形成一个系统化的知识体系。

学习方向很容易规划,但是如果只通过碎片化的学习,对自己的提升是很慢的。

我们搜集整理过这几年字节跳动,以及腾讯,阿里,华为,小米等公司的面试题,把面试的要求和技术点梳理成一份大而全的“ Android架构师”面试 Xmind(实际上比预期多花了不少精力),包含知识脉络 + 分支细节。

img

我们在搭建这些技术框架的时候,还整理了系统的高级进阶教程,会比自己碎片化学习效果强太多

intent.putExtra(CameraActivity.KEY_OUTPUT_FILE_PATH, getSaveFile(getApplication()).getAbsolutePath());

intent.putExtra(CameraActivity.KEY_CONTENT_TYPE, CameraActivity.CONTENT_TYPE_GENERAL);

startActivityForResult(intent, REQUEST_CODE_ACCURATE_BASIC);

}

高精度和普通的区别就在于不同的请求码,而关键就在于返回的处理上。

在onActivityResult中

// 识别成功回调,通用文字识别(高精度版)

if (requestCode == REQUEST_CODE_ACCURATE_BASIC && resultCode == Activity.RESULT_OK) {

RecognizeService.recAccurateBasic(this, getSaveFile(getApplicationContext()).getAbsolutePath(),

new RecognizeService.ServiceListener() {

@Override

public void onResult(String result) {

//弹窗显示识别内容

showDialog(result);

Log.d(“result–>”, result);

}

});

}

如何做好面试突击,规划学习方向?

面试题集可以帮助你查漏补缺,有方向有针对性的学习,为之后进大厂做准备。但是如果你仅仅是看一遍,而不去学习和深究。那么这份面试题对你的帮助会很有限。最终还是要靠资深技术水平说话。

网上学习 Android的资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。建议先制定学习计划,根据学习计划把知识点关联起来,形成一个系统化的知识体系。

学习方向很容易规划,但是如果只通过碎片化的学习,对自己的提升是很慢的。

我们搜集整理过这几年字节跳动,以及腾讯,阿里,华为,小米等公司的面试题,把面试的要求和技术点梳理成一份大而全的“ Android架构师”面试 Xmind(实际上比预期多花了不少精力),包含知识脉络 + 分支细节。

[外链图片转存中…(img-ZdVoo0EA-1718903031335)]

我们在搭建这些技术框架的时候,还整理了系统的高级进阶教程,会比自己碎片化学习效果强太多

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值