前言
最近因为公司业务需求,需要集成腾讯AI的通用文字识别接口,业务逻辑是移动端将图片上传后台,后台请求腾讯AI文字识别接口进行识别,并将识别结果回传给移动端。由于公司后台采用的Java代码编写,而官方提供的只有PHP和Python语言的示例代码,没办法,只能自己干了。
踩坑记录一:接口鉴权
最大的坑就是在接口鉴权这块了,先来看看官方对接口鉴权的说明吧。
上面就是官方的鉴权说明,按照要求和计算步骤写出了第一版的代码,结果返回签名不合法的错误。最后经过排查发现三处地方不正确,也是醉了- -!
错误一 键值拼接部分value进行URL编码
官方的集成中提到URL键值拼接过程value部分需要URL编码,并且用大写字母,于是当时代码就如下写了
//data为键值拼接的StringBuffer对象,params为参数的Map集合
data.append(URLEncoder.encode(params.get(key), "UTF-8").toUpperCase());
通过查阅文档之后才知道,URL编码的时候是不会对数字和字母进行编码的,所以此处需要转为大写的只有被编码转成%e8这类的字符串进行转换大写就好了,我在处理的过程中编码的结果就是大写的,所以此处修改后我就直接把toUpperCase()的方法去掉了,修改后的代码如下:
//data为键值拼接的StringBuffer对象,params为参数的Map集合
data.append(URLEncoder.encode(params.get(key), "UTF-8"));
错误二 图片编码问题
根据要求,需要对图片进行Base64编码,一开始,我用的是Java API自带的Base64的Decoder进行编码,但实际上编码出来的结果和官方要求的结果是不同的,所以需要使用其他的Base64编码工具类,稍后会贴出此工具类代码。
错误三 MD5加密
类似图片编码的问题,MD5加密出来的值和官方要求的值也不同,这个问题有点类似相同的字符串使用Java和PHP进行MD5加密后结果会不同,所以也需要改变MD5加密的算法,从而使得加密结果和官方的结果一致。方法稍后贴上。
踩坑记录二 需要对图片value进行URL编码处理
根据官方接口的说明,上传的是原始图片base64编码数据,一开始我就是上传了Base64编码后的数据,发现还是报错,最后发现还需要对原始图片base64编码后的数据再进行URL编码才可。
至此,接口调用终于成功了。花了我大半天的时间研究- -!下面贴出完整的demo,为了方便我把一些方法都直接放在了一个工具类中了
demo调用入口
public class TecentOCRDemo {
private static final int APP_ID = "你的appid";
public static void main(String[] args) {
final Map<String, String> params = new HashMap<String, String>();
params.put("app_id", String.valueOf(APP_ID));
params.put("time_stamp", String.valueOf(System.currentTimeMillis() / 1000));
params.put("nonce_str", HttpUtils.getRandomString(15));
params.put("image", imgString("file//QQ图片20190305084330.jpg"));
String result = HttpUtils.doPost("https://api.ai.qq.com/fcgi-bin/ocr/ocr_generalocr", params);
System.out.println(result);
}
public static String imgString(String filePath) {
byte[] data;
try {
data = Files.readAllBytes(Paths.get(filePath));
} catch (IOException e) {
e.printStackTrace();
return "";
}
return Base64Util.encode(data);
}
HttpUtils.java
private static final String TENCENT_OCR_KEY = "你的appKey";
public static String doPost(String url, Map<String, String> params) {
String sign;
try {
sign = signForTencentOCR(params);
} catch (Exception e) {
e.printStackTrace();
return e.getMessage();
}
params.put("sign", sign);
StringBuffer data = new StringBuffer();
for (Entry<String, String> entry : params.entrySet()) {
data.append(entry.getKey())
.append("=");
try {
data.append(URLEncoder.encode(entry.getValue(), "UTF-8"));
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
data.append("&");
}
data.deleteCharAt(data.length() - 1);
try {
byte[] postDataBytes = data.toString().getBytes("UTF-8");
HttpURLConnection conn = (HttpURLConnection) new URL(url).openConnection();
conn.setRequestMethod("POST");
conn.setRequestProperty("Content-Type", "application/x-www-form-urlencoded");
conn.setRequestProperty("Content-Length", String.valueOf(postDataBytes.length));
conn.setConnectTimeout(30000);
conn.setReadTimeout(30000);
conn.setDoOutput(true);
conn.getOutputStream().write(postDataBytes);
conn.connect();
StringBuilder sb = new StringBuilder();
if (conn.getResponseCode() == 200) {
Reader in = new BufferedReader(new InputStreamReader(conn.getInputStream(), "UTF-8"));
for (int c; (c = in.read()) >= 0;) {
sb.append((char) c);
}
in.close();
} else {
sb.append("错误码 :")
.append(conn.getResponseCode())
.append(" 错误信息 :")
.append(conn.getResponseMessage());
}
conn.disconnect();
return sb.toString();
} catch (MalformedURLException e) {
e.printStackTrace();
return e.getMessage();
} catch (IOException e) {
e.printStackTrace();
return e.getMessage();
}
}
public static String signForTencentOCR(Map<String, String> params) throws Exception {
final List<String> keys = new ArrayList<String>();
for (Entry<String, String> entry : params.entrySet()) {
keys.add(entry.getKey());
}
Collections.sort(keys, String.CASE_INSENSITIVE_ORDER);
StringBuffer data = new StringBuffer();
for (String key : keys) {
data.append(key)
.append("=")
.append(URLEncoder.encode(params.get(key), "UTF-8"))
.append("&");
}
data.append("app_key=")
.append(TENCENT_OCR_KEY);
return getMD5(data.toString()).toUpperCase();
}
/**
* 计算MD5摘要指值
* @param s
* @return String
*/
public static String getMD5(String s) {
char hexDigits[]={'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
try {
byte[] btInput = s.getBytes();
// 获得MD5摘要算法的 MessageDigest 对象
MessageDigest mdInst = MessageDigest.getInstance("MD5");
// 使用指定的字节更新摘要
mdInst.update(btInput);
// 获得密文
byte[] md = mdInst.digest();
// 把密文转换成十六进制的字符串形式
int j = md.length;
char str[] = new char[j * 2];
int k = 0;
for (int i = 0; i < j; i++) {
byte byte0 = md[i];
str[k++] = hexDigits[byte0 >>> 4 & 0xf];
str[k++] = hexDigits[byte0 & 0xf];
}
return new String(str);
} catch (Exception e) {
e.printStackTrace();
return null;
}
}
// length用户要求产生字符串的长度
public static String getRandomString(int length) {
String str = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
Random random = new Random();
StringBuffer sb = new StringBuffer();
for (int i = 0; i < length; i++) {
int number = random.nextInt(62);
sb.append(str.charAt(number));
}
return sb.toString();
}
Base64Util.java
public class Base64Util {
private static final char last2byte = (char) Integer
.parseInt("00000011", 2);
private static final char last4byte = (char) Integer
.parseInt("00001111", 2);
private static final char last6byte = (char) Integer
.parseInt("00111111", 2);
private static final char lead6byte = (char) Integer
.parseInt("11111100", 2);
private static final char lead4byte = (char) Integer
.parseInt("11110000", 2);
private static final char lead2byte = (char) Integer
.parseInt("11000000", 2);
private static final char[] encodeTable = new char[] { 'A', 'B', 'C', 'D',
'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q',
'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd',
'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q',
'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3',
'4', '5', '6', '7', '8', '9', '+', '/' };
/**
* Base64 encoding.
*
* @param from
* The src data.
* @return cryto_str
*/
public static String encode(byte[] from) {
StringBuilder to = new StringBuilder((int) (from.length * 1.34) + 3);
int num = 0;
char currentByte = 0;
for (int i = 0; i < from.length; i++) {
num = num % 8;
while (num < 8) {
switch (num) {
case 0:
currentByte = (char) (from[i] & lead6byte);
currentByte = (char) (currentByte >>> 2);
break;
case 2:
currentByte = (char) (from[i] & last6byte);
break;
case 4:
currentByte = (char) (from[i] & last4byte);
currentByte = (char) (currentByte << 2);
if ((i + 1) < from.length) {
currentByte |= (from[i + 1] & lead2byte) >>> 6;
}
break;
case 6:
currentByte = (char) (from[i] & last2byte);
currentByte = (char) (currentByte << 4);
if ((i + 1) < from.length) {
currentByte |= (from[i + 1] & lead4byte) >>> 4;
}
break;
}
to.append(encodeTable[currentByte]);
num += 6;
}
}
if (to.length() % 4 != 0) {
for (int i = 4 - to.length() % 4; i > 0; i--) {
to.append("=");
}
}
return to.toString();
}
}
另外附上参考的文章链接:https://www.oschina.net/p/taip