序言
在某些场景我们可能需要识别出图片中的文字,为了高效而准确的识别文字,我们可以使用百度云的OCR来进行识别(部分功能可免费使用)。
官网文档地址:百度云OCR文字识别
1、准备工作
1.1 百度账号申请
地址:账号申请、登录(百度网盘等账号皆可)
1.2 账号实名认证
进入“控制台”,点击右上角个人头像进行实名认证(具体操作可根据文档指引,非常简单)
1.3 创建应用,获取API Key和Secret Key
1、选择文字识别
2、应用管理
3、创建应用
4、复制API Key和Secret Key
至此,我们就拿到了API Key和Secret Key
1.4 获取access_token
文档地址:获取access_token文档
/**
* 获取token类
*/
public class AuthService {
/**
* 获取权限token
* @return 返回示例:
* {
* "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
* "expires_in": 2592000
* }
*/
public static String getAuth() {
// 官网获取的 API Key 更新为你注册的
String clientId = "百度云应用的AK";
// 官网获取的 Secret Key 更新为你注册的
String clientSecret = "百度云应用的SK";
return getAuth(clientId, clientSecret);
}
/**
* 获取API访问token
* 该token有一定的有效期,需要自行管理,当失效时需重新获取.
* @param ak - 百度云官网获取的 API Key
* @param sk - 百度云官网获取的 Securet Key
* @return assess_token 示例:
* "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
*/
public static String getAuth(String ak, String sk) {
// 获取token地址
String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
String getAccessTokenUrl = authHost
// 1. grant_type为固定参数
+ "grant_type=client_credentials"
// 2. 官网获取的 API Key
+ "&client_id=" + ak
// 3. 官网获取的 Secret Key
+ "&client_secret=" + sk;
try {
URL realUrl = new URL(getAccessTokenUrl);
// 打开和URL之间的连接
HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
connection.setRequestMethod("GET");
connection.connect();
// 获取所有响应头字段
Map<String, List<String>> map = connection.getHeaderFields();
// 遍历所有的响应头字段
for (String key : map.keySet()) {
System.err.println(key + "--->" + map.get(key));
}
// 定义 BufferedReader输入流来读取URL的响应
BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String result = "";
String line;
while ((line = in.readLine()) != null) {
result += line;
}
/**
* 返回结果示例
*/
System.err.println("result:" + result);
JSONObject jsonObject = new JSONObject(result);
String access_token = jsonObject.getString("access_token");
return access_token;
} catch (Exception e) {
System.err.printf("获取token失败!");
e.printStackTrace(System.err);
}
return null;
}
}
准备工作完毕,进入识别流程
2、图像识别
2、程序识别
文档地址:通用文字识别(高精度版)
/**
* 重要提示代码中所需工具类
* FileUtil,Base64Util,HttpUtil,GsonUtils请从
* https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
* https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
* https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
* https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
* 下载
*/
public static String accurateBasic() {
// 请求url
String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic";
try {
// 本地文件路径
String filePath = "F:\\study\\src\\main\\resources\\static\\img\\水印文字.jpg";
byte[] imgData = FileUtil.readFileByBytes(filePath);
String imgStr = Base64Util.encode(imgData);
String imgParam = URLEncoder.encode(imgStr, "UTF-8");
String param = "image=" + imgParam;
// 此处请填写自己的token,注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
String accessToken = "24.8a39f0c435cbecbfeb8b85f85f301a91.2592000.1612680267.282335-235xxxxx";
String result = HttpUtil.post(url, accessToken, param);
System.out.println(result);
return result;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
识别结果:
{"log_id": 3370872560323950059, "words_result_num": 20, "words_result": [{"words": "论徐则臣小说的神秘主义叙事"}, {"words": "⊙周文中国海洋大学文学与新闻传播学院,山东青岛266100"}, {"words": "摘要:细读徐则臣的小说,神秘的气息四处弥漫。小说中丰富的民间神秘文化是对传统志怪文化的接续然而其神"}, {"words": "秘背后所透视出的对灵魂的焦、对现代人性的考问,是明显溢出对所调神仙怪的猎奇或膜拜本土文学资源"}, {"words": "后是现代人的生存体验设造迷宫,设置陌生人和省略空缺等形式形成的神秘主义救事示出对先锋小说采用的现"}, {"words": "代主义形式的借鉴,而其始终不忘对社会现实生活的幕写与观照,又显现出对为神秘而神秘的尽情于语言和形式游"}, {"words": "戏的先锋主义的反拨可以说徐则臣的神秘主义叙事是融合了中国传统文学的题材和西方现代主义文学的形式"}, {"words": "蕴,它既是对标榜为现实主义的日渐平庸化的圈于琐日常生活的文学的抵抗也是于下破碎了的充满不确"}, {"words": "定性的现实的把握,是徐则臣所独有的对当下纯文学道路的探索"}, {"words": "关键词徐则臣小说神秘主义传统现代"}, {"words": "从2002年第一次公开发表短篇小说《忆秦娥到006年第一部小说集《鸭子是怎样飞上天的》出版,再到如今"}, {"words": "《路撒冷》这部历时六年的长篇巨作的出版,徐则臣作为新世纪以来备受关注的70后代表作家,显示出了旺盛的"}, {"words": "创作力。与此同时,评论界对其作品的解读也随着他创作的不断丰富与日俱增。纵观对徐则臣小说的评论,“京漂"}, {"words": "和“花街”系列的人物形象塑造、理想主义精神故乡叙事等是主要聚焦点,而对于显示徐则臣小说另一面向的“谜"}, {"words": "团”系列却未给予充分的关注。至于何为“谜团”系列这其实是一个比较昧不明的分类“在题材上它们或属于"}, {"words": "京漂,或属于故乡但又似乎都心不在焉”,这一系列小说的特点在于沉溺形而上的思索,具有浓郁的神秘主义"}, {"words": "息。而细读徐则臣的小说创作,我们会发现这种神秘主义气息实际上处处可见:身份背景不明或具有灵异能力的人"}, {"words": "物,神秘而恐怖的意象,曲折离奇的情节这些共同构成了徐则臣小说神秘主义叙事的特点神秘主义作为新时期"}, {"words": "文学的重要审美思潮,既植根于源远流长的中国传统的神秘文化,又接受了西方现代主义的滋养那徐则臣在面对"}, {"words": "地在微度且和主的的如由的地租"}]}
上传结果与原文基本一致,识别效果还是非常好的。官网还有很多识别方式,有兴趣的朋友可以尝试。
3、上传图片识别
与第二条基本时一样的,只是从本地图片识别到了上传图片识别
3.1 页面代码
<!DOCTYPE html>
<html lang="zh" xmlns:th="http://www.thymeleaf.org" >
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<!-- 一定要加上enctype="multipart/form-data" -->
<form th:action="@{/img}" method="post" enctype="multipart/form-data">
<p>ahdsfljkahsfodiahsoi</p>
<input type="file" name="file">
<input type="submit" value="submit">
</form>
</body>
</html>
3.2 controller
@Controller
public class OcrController {
@GetMapping("/img")
public String getImage() {
return "imgtest";
}
@PostMapping("/img")
@ResponseBody
public void getIm(MultipartFile file) throws IOException {
AccurateBasic.accurateBasic(file.getBytes());
}
}
3.3 识别类
public static String accurateBasic(byte[] imgData) {
// 请求url
String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic";
try {
String imgStr = Base64Util.encode(imgData);
String imgParam = URLEncoder.encode(imgStr, "UTF-8");
String param = "image=" + imgParam;
// 此处请填写自己的token,注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
String accessToken = "24.8a39f0c435cbecbfeb8b85f85f301a91.2592000.1612680267.282335-235xxxxx";
String result = HttpUtil.post(url, accessToken, param);
System.out.println(result);
return result;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
识别结果与第二条基本一致,从上传到识别完毕大概4-5秒,识别度和速度非常不错了。
此处只是简单举例,更多功能可自行了解。