1、以通用文字标准版为例:获取ak、sk、appId
不做过多介绍
2、导入坐标
<!--百度图像识别-->
<dependency>
<groupId>com.baidu.aip</groupId>
<artifactId>java-sdk</artifactId>
<version>4.16.11</version>
</dependency>
3、查看百度ocr文档,下载对应工具类
链接下面看可以看出来需要将文件转为byte数组,而后再进行解析,当然也还有其他要求,如文件大小。
4、小的pdf直接解析
//现在是写死在内存的数据
public staic String token ="";//自己获取的token放在缓存中
public static Long end_date=1672015917000l;//过期时间
/**
* 获取pdf的解析结果
* @param pdfData pdf的byte数组
* @param pdffilenum 页数
* @return
*/
public static Map<String, String> generalBasicAPIPdf(byte[] pdfData, int pdffilenum) {
String resu = "";
// 请求url
String url = "https://aip