一、准备阶段
进入百度AI网址点击这里跳转 ,点击导航栏的开放能力 ---- 文字识别 ---- 通用文字识别,进入文字识别OCR界面。
在文字识别ORC界面点击 技术文档 进入帮助文档。
在左侧可以看到API文档 (介绍了相应的接口)、以及HTTP-SDK文档(介绍了不同的开发语言,描述百度文字识别接口服务的相关技术内容),我用的是Java语言,所以以下介绍这个了,其他语言可以自行看文档。
接下来就是下载相关jar包,可以点击这里下载。
这个jar包添加SDK工具包aip-java-sdk-version.jar和第三方依赖工具包json-20160810.jar log4j-1.2.17.jar。
可以将下载的aip-java-sdk-version.zip解压后,复制到工程文件夹中。
也可以在Eclipse右键“工程 -> Properties -> Java Build Path -> Add JARs”。
如果要导入maven依赖得话:
<dependency>
<groupId>com.baidu.aip</groupId>
<artifactId>java-sdk</artifactId>
<version>${version}</version>
</dependency>
其中,version为版本号,添加完成后,用户就可以在工程中使用OCR Java SDK。其中版本号可在maven官网查询。
二、编码阶段
public class Sample {
//设置APPID/AK/SK
public static final String APP_ID = "你的 App ID";
public static final String API_KEY = "你的 Api Key";
public static final String SECRET_KEY = "你的 Secret Key";
public static void main(String[] args) {
// 初始化一个AipOcr
AipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);
// 可选:设置网络连接参数
client.setConnectionTimeoutInMillis(2000);
client.setSocketTimeoutInMillis(60000);
// 可选:设置代理服务器地址, http和socket二选一,或者均不设置
client.setHttpProxy("proxy_host", proxy_port); // 设置http代理
client.setSocketProxy("proxy_host", proxy_port); // 设置socket代理
// 可选:设置log4j日志输出格式,若不设置,则使用默认配置
// 也可以直接通过jvm启动参数设置此环境变量
System.setProperty("aip.log4j.conf", "path/to/your/log4j.properties");
// 调用接口
String path = "test.jpg";
JSONObject res = client.basicGeneral(path, new HashMap<String, String>());
System.out.println(res.toString(2));
}
}
可以看到我们需要自己的 APPID/AK/SK 这时候就要回到百度Ai的官网创建我们自己的 APPID/AK/SK 。
点击右上角控制台 ,登录之后点击左侧 – 文字识别 – 进入应用列表创建一个应用。应用创建成功之后就会看到自己的 APPID/AK/SK 。
把这个 APPID/AK/SK 分别复制 一一对应 在上面 的代码中。path改成自己的本地的图片路径,就可以运行啦~~~
比如说我运行这个熊猫的表情包
执行结果如下图所示:
调用百度AI接口 实现图片识别文字就完成啦~
还有其他的识别接口比如说:身份证识别,车牌识别,在java文档中,自行观看吧~指路