一、什么是通用文字识别?
通用文字识别又叫通用文字OCR识别,文字识别,文字图片识别,通用文字识别是一种算法识别技术,它能够将图像中的文字转换为可编辑的文本格式,可支持多种类型图片类型。
二、通用文字识别适用哪些场景?
例如:教育场景
1.学习资料整理:学生可以将教材、参考书籍中的重点内容拍照进行文字识别,然后整理成电子笔记,方便复习和查阅。
2.作业批改自动化:教师可以利用通用文字识别技术对学生的手写作业进行识别,实现部分客观题的自动批改,提高批改效率。
3.在线教育资源制作:教育机构可以将纸质教材、讲义等转换为电子文档,然后制作成在线课程资源,方便学生在线学习。
三、如何用PHP进行通用文字识别接口调用?
下面我们以阿里云为例,通过PHP实现调用:
<?php
$host = "https://kzwordocr.market.alicloudapi.com";
$path = "/api-mall/api/general/ocr";
$method = "POST";
$appcode = "你自己的AppCode";
$headers = array();
array_push($headers, "Authorization:APPCODE " . $appcode);
//根据API的要求,定义相对应的Content-Type
array_push($headers, "Content-Type".":"."application/x-www-form-urlencoded; charset=UTF-8");
$querys = "";
$bodys = "image=image&url=url";
$url = $host . $path;
$curl = curl_init();
curl_setopt($curl, CURLOPT_CUSTOMREQUEST, $method);
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_HTTPHEADER, $headers);
curl_setopt($curl, CURLOPT_FAILONERROR, false);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
curl_setopt($curl, CURLOPT_HEADER, true);
if (1 == strpos("$".$host, "https://"))
{
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
}
curl_setopt($curl, CURLOPT_POSTFIELDS, $bodys);
var_dump(curl_exec($curl));
?>
正确返回示例代码如下:
{
"msg": "成功",
"success": true,
"code": 200,
"data": {
"orderNo": "202407102026336827870",
"info": [
{
"line_no": 0, //文本行编号,按从左至右、从上至下顺序依次排列
"confidence": 0.96655273, //行文本识别置信度 0-1
"line_content": "姓名", //识别出的文本行内容
"line_position": {
"x": 53,
"width": 53,
"y": 66,
"line_direction": 0,
"height": 22
}
},
{
"line_no": 1,
"confidence": 0.98909503,
"line_content": "陈海江",
"line_position": {
"x": 102,
"width": 63,
"y": 63,
"line_direction": 0,
"height": 23
}
}
]
}
}
line_no 文本行编号,按从左至右、从上至下顺序依次排列
line_content 识别出的文本行内容
confidence 行文本识别置信度
line_position 文本行位置信息,表示为坐标和旋转角度(左上角X,左上角Y,宽Width,高Height,旋转角度Line Position)+x左上角顶点横坐标X +y 左上角顶点纵坐标Y
width 矩形框的宽
height 矩形框的高
line_direction 文本行的旋转角度
words 文本行内单字符的内容数组,数组元素为一个Json结构,包含character和confidence
character 候选字符character
confidence 单字符的识别置信度