腾讯AI文字识别接口Java访问代码以及踩坑记录

最新推荐文章于 2024-04-20 23:12:18 发布

zhpnp

最新推荐文章于 2024-04-20 23:12:18 发布

阅读量1.2k

点赞数 5

文章标签： Java 腾讯AI 接口鉴权

本文链接：https://blog.csdn.net/zhpnp/article/details/98877095

版权

前言

最近因为公司业务需求，需要集成腾讯AI的通用文字识别接口，业务逻辑是移动端将图片上传后台，后台请求腾讯AI文字识别接口进行识别，并将识别结果回传给移动端。由于公司后台采用的Java代码编写，而官方提供的只有PHP和Python语言的示例代码，没办法，只能自己干了。

踩坑记录一：接口鉴权

最大的坑就是在接口鉴权这块了，先来看看官方对接口鉴权的说明吧。
在这里插入图片描述

上面就是官方的鉴权说明，按照要求和计算步骤写出了第一版的代码，结果返回签名不合法的错误。最后经过排查发现三处地方不正确，也是醉了- -！

错误一键值拼接部分value进行URL编码

官方的集成中提到URL键值拼接过程value部分需要URL编码，并且用大写字母，于是当时代码就如下写了

//data为键值拼接的StringBuffer对象，params为参数的Map集合
data.append(URLEncoder.encode(params.get(key), "UTF-8").toUpperCase());

通过查阅文档之后才知道，URL编码的时候是不会对数字和字母进行编码的，所以此处需要转为大写的只有被编码转成%e8这类的字符串进行转换大写就好了，我在处理的过程中编码的结果就是大写的，所以此处修改后我就直接把toUpperCase()的方法去掉了，修改后的代码如下：

//data为键值拼接的StringBuffer对象，params为参数的Map集合
data.append(URLEncoder.encode(params.get(key), "UTF-8"));

错误二图片编码问题

根据要求，需要对图片进行Base64编码，一开始，我用的是Java API自带的Base64的Decoder进行编码，但实际上编码出来的结果和官方要求的结果是不同的，所以需要使用其他的Base64编码工具类，稍后会贴出此工具类代码。

错误三 MD5加密

类似图片编码的问题，MD5加密出来的值和官方要求的值也不同，这个问题有点类似相同的字符串使用Java和PHP进行MD5加密后结果会不同，所以也需要改变MD5加密的算法，从而使得加密结果和官方的结果一致。方法稍后贴上。

踩坑记录二需要对图片value进行URL编码处理

根据官方接口的说明，上传的是原始图片base64编码数据，一开始我就是上传了Base64编码后的数据，发现还是报错，最后发现还需要对原始图片base64编码后的数据再进行URL编码才可。

至此，接口调用终于成功了。花了我大半天的时间研究- -！下面贴出完整的demo,为了方便我把一些方法都直接放在了一个工具类中了

demo调用入口

public class TecentOCRDemo {

	private static final int APP_ID = "你的appid";

	public static void main(String[] args) {
		final Map<String, String> params = new HashMap<String, String>();
		params.put("app_id", String.valueOf(APP_ID));
		params.put("time_stamp", String.valueOf(System.currentTimeMillis() / 1000));
		params.put("nonce_str", HttpUtils.getRandomString(15));
		params.put("image", imgString("file//QQ图片20190305084330.jpg"));
		String result = HttpUtils.doPost("https://api.ai.qq.com/fcgi-bin/ocr/ocr_generalocr", params);
		System.out.println(result);
	}
	
	public static String imgString(String filePath) {
		byte[] data;
		try {
			data = Files.readAllBytes(Paths.get(filePath));
		} catch (IOException e) {
			e.printStackTrace();
			return "";
		}
		return Base64Util.encode(data);
	}

HttpUtils.java

private static final String TENCENT_OCR_KEY = "你的appKey";

	public static String doPost(String url, Map<String, String> params) {
	String sign;
		try {
			sign = signForTencentOCR(params);
		} catch (Exception e) {
			e.printStackTrace();
			return e.getMessage();
		}

		params.put("sign", sign);
		StringBuffer data = new StringBuffer();
		for (Entry<String, String> entry : params.entrySet()) {
			data.append(entry.getKey())
				.append("=");
			try {
				data.append(URLEncoder.encode(entry.getValue(), "UTF-8"));
			} catch (UnsupportedEncodingException e) {
				e.printStackTrace();
			}
			data.append("&");
		}

		data.deleteCharAt(data.length() - 1);

		try {
			byte[] postDataBytes = data.toString().getBytes("UTF-8");
			HttpURLConnection conn = (HttpURLConnection) new URL(url).openConnection();
			conn.setRequestMethod("POST");
			conn.setRequestProperty("Content-Type", "application/x-www-form-urlencoded");
			conn.setRequestProperty("Content-Length", String.valueOf(postDataBytes.length));
			conn.setConnectTimeout(30000);
			conn.setReadTimeout(30000);
			conn.setDoOutput(true);
			conn.getOutputStream().write(postDataBytes);
			conn.connect();

			StringBuilder sb = new StringBuilder();
			if (conn.getResponseCode() == 200) {
				Reader in = new BufferedReader(new InputStreamReader(conn.getInputStream(), "UTF-8"));
				for (int c; (c = in.read()) >= 0;) {
					sb.append((char) c);
				}
				in.close();
			} else {
				sb.append("错误码 ：")
					.append(conn.getResponseCode())
					.append(" 错误信息 ：")
					.append(conn.getResponseMessage());
			}

			conn.disconnect();
			return sb.toString();
		} catch (MalformedURLException e) {
			e.printStackTrace();
			return e.getMessage();
		} catch (IOException e) {
			e.printStackTrace();
			return e.getMessage();
		}


	}

	public static String signForTencentOCR(Map<String, String> params) throws Exception {
		final List<String> keys = new ArrayList<String>();
		for (Entry<String, String> entry : params.entrySet()) {
			keys.add(entry.getKey());
		}
		Collections.sort(keys, String.CASE_INSENSITIVE_ORDER);
	StringBuffer data = new StringBuffer();
		for (String key : keys) {
			data.append(key)
			.append("=")
			.append(URLEncoder.encode(params.get(key), "UTF-8"))
			.append("&");
		}

		data.append("app_key=")
			.append(TENCENT_OCR_KEY);
		return getMD5(data.toString()).toUpperCase();
	}

	/**
	 * 计算MD5摘要指值
	 * @param s
	 * @return String
	 */
	public static String getMD5(String s) {  
        char hexDigits[]={'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};         
        try {  
            byte[] btInput = s.getBytes();  
            // 获得MD5摘要算法的 MessageDigest 对象  
            MessageDigest mdInst = MessageDigest.getInstance("MD5");  
            // 使用指定的字节更新摘要  
            mdInst.update(btInput);  
            // 获得密文  
            byte[] md = mdInst.digest();  
            // 把密文转换成十六进制的字符串形式  
            int j = md.length;  
            char str[] = new char[j * 2];  
            int k = 0;  
            for (int i = 0; i < j; i++) {  
                byte byte0 = md[i];  
                str[k++] = hexDigits[byte0 >>> 4 & 0xf];  
                str[k++] = hexDigits[byte0 & 0xf];  
            }  
            return new String(str);  
        } catch (Exception e) {  
            e.printStackTrace();  
            return null;  
        }  
    }

	// length用户要求产生字符串的长度
	public static String getRandomString(int length) {
		String str = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
		Random random = new Random();
		StringBuffer sb = new StringBuffer();
		for (int i = 0; i < length; i++) {
			int number = random.nextInt(62);
			sb.append(str.charAt(number));
		}
		return sb.toString();
	}

Base64Util.java

public class Base64Util {
	private static final char last2byte = (char) Integer
			.parseInt("00000011", 2);
	private static final char last4byte = (char) Integer
			.parseInt("00001111", 2);
	private static final char last6byte = (char) Integer
			.parseInt("00111111", 2);
	private static final char lead6byte = (char) Integer
			.parseInt("11111100", 2);
	private static final char lead4byte = (char) Integer
			.parseInt("11110000", 2);
	private static final char lead2byte = (char) Integer
			.parseInt("11000000", 2);
	private static final char[] encodeTable = new char[] { 'A', 'B', 'C', 'D',
			'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q',
			'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd',
			'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q',
			'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3',
			'4', '5', '6', '7', '8', '9', '+', '/' };

	/**
	 * Base64 encoding.
	 * 
	 * @param from
	 *            The src data.
	 * @return cryto_str
	 */
	public static String encode(byte[] from) {
		StringBuilder to = new StringBuilder((int) (from.length * 1.34) + 3);
		int num = 0;
		char currentByte = 0;
		for (int i = 0; i < from.length; i++) {
			num = num % 8;
			while (num < 8) {
				switch (num) {
				case 0:
					currentByte = (char) (from[i] & lead6byte);
					currentByte = (char) (currentByte >>> 2);
					break;
				case 2:
					currentByte = (char) (from[i] & last6byte);
					break;
				case 4:
					currentByte = (char) (from[i] & last4byte);
					currentByte = (char) (currentByte << 2);
					if ((i + 1) < from.length) {
						currentByte |= (from[i + 1] & lead2byte) >>> 6;
					}
					break;
				case 6:
					currentByte = (char) (from[i] & last2byte);
					currentByte = (char) (currentByte << 4);
					if ((i + 1) < from.length) {
						currentByte |= (from[i + 1] & lead4byte) >>> 4;
					}
					break;
				}
				to.append(encodeTable[currentByte]);
				num += 6;
			}
		}
		if (to.length() % 4 != 0) {
			for (int i = 4 - to.length() % 4; i > 0; i--) {
				to.append("=");
			}
		}
		return to.toString();
	}
}

另外附上参考的文章链接：https://www.oschina.net/p/taip

zhpnp

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
腾讯AI文字识别接口Java访问代码以及踩坑记录

前言最近因为公司业务需求，需要集成腾讯AI的通用文字识别接口，业务逻辑是移动端将图片上传后台，后台请求腾讯AI文字识别接口进行识别，并将识别结果回传给移动端。由于公司后台采用的Java代码编写，而官方提供的只有PHP和Python语言的示例代码，没办法，只能自己干了。踩坑记录一：接口鉴权最大的坑就是在接口鉴权这块了，先来看看官方对接口鉴权的说明吧。上面就是官方的鉴权说明，按照要求和计算步...
复制链接

扫一扫