java调用百度接口,实现图片文字识别功能,详细操作说明和代码分享

一、下载百度sdk

=========

1.1在浏览器输入网址http://ai.baidu.com/或者百度搜索‘百度ai’点击第一个。点击主页的开放能力,看到通用文字识别。如下图所示:

1.2、点击技术文档,里面有SDK。

1.3、可以看到在文字识别在的api文档有多个接口,你可以根据你的需求来选择对应的接口,这里选择java

地址https://ai.baidu.com/ai-doc/OCR/Ikibizxql,页面截图

1.5、在官方网站下载所需的jar包,下图所示,选择文字识别,然后下载右边的java SDK的jar包。

sdk下载地址:https://ai.baidu.com/sdk#vis,不想找,直接点地址下载SDK。

下载的Java sdk的文件名为:aip-java-sdk-4.15.4.zip

解压后为:

总共4个jar。

二、新建SpringBoot项目,引入百度sdk

========================

新建springboot项目,这里就略过,比较简单,创建后,把百度的4个jar放在项目的lib目录下,如下图:

这里引入百度jar,使用自定义引入本地jar方式引入,具体引入方式见pom.xml文件。

pom.xml文件内容为:

<?xml version="1.0" encoding="UTF-8"?>

<project xmlns=“http://maven.apache.org/POM/4.0.0” xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance”

xsi:schemaLocation=“http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd”>

4.0.0

org.springframework.boot

spring-boot-starter-parent

2.4.3

com.example

demo

0.0.1-SNAPSHOT

demo

Demo project for Spring Boot

<java.version>1.8</java.version>

org.springframework.boot

spring-boot-starter

aip-java-sdk

aip-java-sdk

4.15.4

system

${project.basedir}/lib/aip-java-sdk-4.15.4.jar

json-20160810

json-20160810

20160810

system

${project.basedir}/lib/json-20160810.jar

slf4j-api

slf4j-api

1.7.25

system

${project.basedir}/lib/slf4j-api-1.7.25.jar

slf4j-simple

slf4j-simple

1.7.25

system

${project.basedir}/lib/slf4j-simple-1.7.25.jar

org.springframework.boot

spring-boot-starter-test

test

org.springframework.boot

spring-boot-maven-plugin

三、申请百度的AppId、API Key、Secret Key

===============================

登录https://ai.baidu.com/后,点控制台。

这时就生成百度接口的AppId、API Key、Secret Key了。

四、获取百度图片识别自带的Java用例

===================

图片识别Java用例地址为:https://ai.baidu.com/ai-doc/OCR/1k3h7y3db

Java用例具体代码如下:

package com.baidu.ai.aip;

import com.baidu.ai.aip.utils.Base64Util;

import com.baidu.ai.aip.utils.FileUtil;

import com.baidu.ai.aip.utils.HttpUtil;

import java.net.URLEncoder;

/**

  • 通用文字识别(高精度版)

*/

public class AccurateBasic {

/**

  • 重要提示代码中所需工具类

  • FileUtil,Base64Util,HttpUtil,GsonUtils请从

  • https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72

  • https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2

  • https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3

  • https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3

  • 下载

*/

public static String accurateBasic() {

// 请求url

String url = “https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic”;

try {

// 本地文件路径

String filePath = “[本地文件路径]”;

byte[] imgData = FileUtil.readFileByBytes(filePath);

String imgStr = Base64Util.encode(imgData);

String imgParam = URLEncoder.encode(imgStr, “UTF-8”);

String param = “image=” + imgParam;

// 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。

String accessToken = “[调用鉴权接口获取的token]”;

String result = HttpUtil.post(url, accessToken, param);

System.out.println(result);

return result;

} catch (Exception e) {

e.printStackTrace();

}

return null;

}

public static void main(String[] args) {

AccurateBasic.accurateBasic();

}

}

代码用例需要accessToken,这个值是通过API Key、Secret Key获取的,获取代码如下:

import org.json.JSONObject;

import java.io.BufferedReader;

import java.io.InputStreamReader;

import java.net.HttpURLConnection;

import java.net.URL;

import java.util.List;

import java.util.Map;

/**

  • 获取token类

*/

public class AuthService {

public static void main(String[] args){

String token=getAuth();

System.out.println(token);

}

/**

  • 获取权限token

  • @return 返回示例:

  • {

  • “access_token”: “24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567”,

  • “expires_in”: 2592000

  • }

*/

public static String getAuth() {

最后

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长,自己不成体系的自学效果低效漫长且无助。

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Android开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!

如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。**

[外链图片转存中…(img-5FCVUCBS-1715449693354)]

[外链图片转存中…(img-4VFyEXfV-1715449693355)]

[外链图片转存中…(img-bIVuklLi-1715449693355)]

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Android开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!

如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

  • 9
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
文件为压缩包,包括多个java识别图片文字的项目,国内网站上资料比较少,项目都整理出了测试类及说明,都包含着源代码及jar包、安装包、训练库。希望用得到的人少走弯路,资源都精心整理测试过,高分是必须的。 javaocr项目 纯java程序,国内网站几乎没有见到相关资料。 此项目提供了图形界面的测试类: net.sourceforge.javaocr.main.java javaocr2项目 与以上javaorc属同一项目的不同分支,纯java实现,以下3个测试类请参考。 个人对此项目感觉不错,虽然存在些问题,但是只要训练库好,英文和数字识别率很高。 我用此项目把某网站的数字验证码都截了图做成了训练库,识别率95%以上,用browserTest简单实现了程序自动登录与各种操作功能。 测试类: TestDemo.java MyDemo.java MyDemo2.java Longan-master项目 此项目也是纯java实现,识别英文和数字效果还不错,国内网站几乎没有任何相关资料。 测试类: com.zarkonnen.longan.Main 使用开发工具,请设置程序输入参数为:-o c:/111.txt c:/entest.png 代表输出文件和识别图片 Java_imagetotext项目 安装tesseract-ocr-setup-3.02.02.exe文件,通过java调用tesseract.exe文件识别图片,输出识别结果 测试类: com.chillyfacts.com.my_main.java 根据实际情况修改输入图片、输出文件名、tesseract.exe文件所在路径 Tess4J-3.4.7项目 知名度最大的java识别程序了。 我的环境是windows7 64位 jdk1.8 64位 各种折腾,痛苦的尝试了各版本,基本都是报模块加载失败,安装上vc_redist.x64_2015.exe后执行成功,但是在xp32位还是没有成功。 测试类: TesseractExample.java 测试英文识别 ChOcr.java 测试中文识别 tesseract3.03项目 测试类: de.vorb.tesseract.example.BasicExample 需要加载libtesseract303.dll 运行后一直报异常,没有搞定,也不打算深究了,遗憾!有人成功了,请分享为谢。
你可以使用百度的OCR接口实现Java调用百度接口图片文字的功能。首先,你需要注册百度开发者账号并创建应用,获取到API Key和Secret Key。 接下来,你可以使用Java的网络请求库,例如Apache HttpClient或OkHttp,来发送HTTP POST请求给百度OCR接口。在请求中,你需要包含以下参数: - 接口地址:https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic - 请求参数:image(图片的Base64编码)、access_token(通过API Key和Secret Key获取的访问令牌) - 请求头:Content-Type设置为application/x-www-form-urlencoded 以下是一个示例代码: ```java import org.apache.http.HttpEntity; import org.apache.http.HttpResponse; import org.apache.http.NameValuePair; import org.apache.http.client.entity.UrlEncodedFormEntity; import org.apache.http.client.methods.HttpPost; import org.apache.http.client.utils.URLEncodedUtils; import org.apache.http.impl.client.CloseableHttpClient; import org.apache.http.impl.client.HttpClients; import org.apache.http.message.BasicNameValuePair; import org.apache.http.util.EntityUtils; import java.io.IOException; import java.util.ArrayList; import java.util.List; public class BaiduOCR { public static void main(String[] args) throws IOException { // 设置API Key和Secret Key String apiKey = "your_api_key"; String secretKey = "your_secret_key"; // 获取访问令牌 String accessToken = getAccessToken(apiKey, secretKey); // 图片路径 String imagePath = "path_to_your_image"; // 将图片转为Base64编码 String imageBase64 = getImageBase64(imagePath); // 调用百度OCR接口 String result = callBaiduOCR(imageBase64, accessToken); System.out.println(result); } // 获取访问令牌 private static String getAccessToken(String apiKey, String secretKey) throws IOException { CloseableHttpClient httpClient = HttpClients.createDefault(); HttpPost httpPost = new HttpPost("https://aip.baidubce.com/oauth/2.0/token"); List<NameValuePair> params = new ArrayList<>(); params.add(new BasicNameValuePair("grant_type", "client_credentials")); params.add(new BasicNameValuePair("client_id", apiKey)); params.add(new BasicNameValuePair("client_secret", secretKey)); httpPost.setEntity(new UrlEncodedFormEntity(params)); HttpResponse response = httpClient.execute(httpPost); HttpEntity entity = response.getEntity(); String result = EntityUtils.toString(entity); httpClient.close(); return result.split("\"")[3]; } // 将图片转为Base64编码 private static String getImageBase64(String imagePath) { // TODO: 实现图片转为Base64编码的逻辑 return ""; } // 调用百度OCR接口 private static String callBaiduOCR(String imageBase64, String accessToken) throws IOException { CloseableHttpClient httpClient = HttpClients.createDefault(); HttpPost httpPost = new HttpPost("https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"); List<NameValuePair> params = new ArrayList<>(); params.add(new BasicNameValuePair("image", imageBase64)); params.add(new BasicNameValuePair("access_token", accessToken)); httpPost.setEntity(new UrlEncodedFormEntity(params)); HttpResponse response = httpClient.execute(httpPost); HttpEntity entity = response.getEntity(); String result = EntityUtils.toString(entity); httpClient.close(); return result; } } ``` 请注意,在上述代码中,你需要实现图片转为Base64编码的逻辑,你可以使用第三方库,如Apache Commons Codec,来实现功能。 希望这能帮到你!如果有任何其他问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值