[百度API识别图片 ]

最新推荐文章于 2024-04-15 18:15:01 发布

是汤圆丫

最新推荐文章于 2024-04-15 18:15:01 发布

阅读量707

点赞数

文章标签：百度

汤圆

本文链接：https://blog.csdn.net/sqL520lT/article/details/131721604

版权

该文章演示了如何利用百度AI开放平台的JavaSDK进行OCR文字识别。通过创建应用获取API密钥，引入SDK依赖，然后读取图片并调用AipOcr的basicGeneral方法识别图片中的文字，支持中英文混合及检测方向等功能。

摘要由CSDN通过智能技术生成

🥞前言:

🥞代码实现:

🥞首先，我们需要引入百度 AI 开放平台提供的 Java SDK：

🥞前言:

记录一下了

🥞代码实现:

下面给出一个 Java 图片识别的详细 demo，这里以百度 AI 开放平台提供的 OCR 文字识别 API 为例。
首先，我们需要在百度 AI 开放平台上创建一个应用，获取 AppID、API Key 和 Secret Key。然后，我们可以使用百度提供的 Java SDK 来实现 OCR 文字识别的功能。这里需要注意的是，百度 AI 开放平台提供了两个版本的 Java SDK，一个是基于 Apache HttpClient 的版本，另一个是基于 OkHttp 的版本。这里我们使用基于 OkHttp 的版本来实现 OCR 文字识别的功能。

🥞首先，我们需要引入百度 AI 开放平台提供的 Java SDK：

<dependency>
    <groupId>com.baidu.aip</groupId>
    <artifactId>baidu-aip-sdk</artifactId>
    <version>3.6.0</version>
</dependency>

import com.baidu.aip.ocr.AipOcr;
import org.json.JSONArray;
import org.json.JSONObject;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.HashMap;

public class ImageRecognition {

    // 设置 APPID/AK/SK
    public static final String APP_ID = "your_app_id";
    public static final String API_KEY = "your_api_key";
    public static final String SECRET_KEY = "your_secret_key";

    public static void main(String[] args) {
        byte[] imageData = getImageData("test.png"); // 读取测试图片数据
        String result = recognizeText(imageData); // 识别图片中的文字
        System.out.println(result);
    }

    /**
     * 读取图片数据
     */
    private static byte[] getImageData(String imagePath) {
        try (InputStream inputStream = ImageRecognition.class.getClassLoader().getResourceAsStream(imagePath);
             ByteArrayOutputStream outputStream = new ByteArrayOutputStream()) {
            byte[] buffer = new byte[1024];
            int len;
            while ((len = inputStream.read(buffer)) != -1) {
                outputStream.write(buffer, 0, len);
            }
            return outputStream.toByteArray();
        } catch (IOException e) {
            e.printStackTrace();
            return null;
        }
    }

    /**
     * 识别图片中的文字
     */
    private static String recognizeText(byte[] imageData) {
        // 初始化一个 AipOcr 客户端
        AipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);

        // 设置请求参数
        HashMap<String, String> options = new HashMap<>();
        options.put("language_type", "CHN_ENG"); // 中英文混合
        options.put("detect_direction", "true"); // 检测朝向
        options.put("detect_language", "true"); // 是否检测语言
        options.put("probability", "true"); // 是否返回识别结果中每一行的置信度

        // 发送 OCR 识别请求
        JSONObject result = client.basicGeneral(imageData, options);
        System.out.println(result.toString());

        // 解析 OCR 识别结果
        StringBuilder stringBuilder = new StringBuilder();
        JSONArray jsonArray = result.getJSONArray("words_result");
        for (int i = 0; i < jsonArray.length(); i++) {
            JSONObject jsonObject = jsonArray.getJSONObject(i);
            String text = jsonObject.getString("words");
            stringBuilder.append(text).append("\n");
        }
        return stringBuilder.toString();
    }
}

实现中，我们通过 getImageData() 方法来读取测试图片的数据，然后通过 recognizeText() 方法来识别图片中的文字。在 recognizeText() 方法中，我们首先初始化了一个 AipOcr 客户端，然后设置了请求参数，最后发送 OCR 识别请求并解析识别结果。
在这个实现中，我们使用了默认的 OCR 识别模式，即通用文字识别模式，适用于识别一般场景下的文字。如果需要识别特定场景下的文字，如银行卡、车牌等，可以使用不同的 OCR 识别模式。同时，我们也可以根据需要自定义 OCR 识别参数，详细的参数说明可以参考百度 AI 开放平台的文档。