OCR文字识别接口如何用PHP进行调用

一、什么是OCR文字识别接口?

OCR文字识别接口,是指将图像中文字内容进行识别,例如可以识别照片中的文字信息,方便对文档、书籍、名片等各种载体上的文字进行数字化处理。

二、OCR文字识别接口适用于哪些场景?

例如:

1.办公自动化领域

(1)文档转换和数字化:可将纸质文档、书籍、报纸、合同、简历等大量纸质文件快速转换成可编辑和可搜索的电子文档,便于存储、检索、共享和后续的编辑处理,提高办公效率,减少纸质文件的存放空间。

(2)表格处理:能自动识别表格内容,并将其转换为结构化的数据,方便进行数据的统计、分析和汇总,例如对项目报告、财务报表中的表格进行识别和数据提取。

2.交通领域

(1)车牌识别:用于识别车牌号码、车牌颜色、车牌类型、车标、车身颜色等车辆特征信息,广泛应用于移动警务、占道停车管理、停车场管理、高速公路收费、交通监控与执法等场景,实现车辆的快速识别和管理,提高交通管理的效率和准确性。

(2)驾驶证、行驶证识别:在交通执法、车辆保险理赔、二手车交易等场景中,可快速提取驾驶证和行驶证上的关键信息,如证件号码、姓名、准驾车型、有效期等,节省人工录入的时间和成本,同时降低错误率。

三、如何用PHP实现OCR文字识别接口调用?

下面以阿里云为例,通过PHP实现接口调用:

<?php
    $host = "https://kzwordocr.market.alicloudapi.com";
    $path = "/api-mall/api/general/ocr";
    $method = "POST";
    $appcode = "你自己的AppCode";
    $headers = array();
    array_push($headers, "Authorization:APPCODE " . $appcode);
    //根据API的要求,定义相对应的Content-Type
    array_push($headers, "Content-Type".":"."application/x-www-form-urlencoded; charset=UTF-8");
    $querys = "";
    $bodys = "image=image&url=url";
    $url = $host . $path;

    $curl = curl_init();
    curl_setopt($curl, CURLOPT_CUSTOMREQUEST, $method);
    curl_setopt($curl, CURLOPT_URL, $url);
    curl_setopt($curl, CURLOPT_HTTPHEADER, $headers);
    curl_setopt($curl, CURLOPT_FAILONERROR, false);
    curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($curl, CURLOPT_HEADER, true);
    if (1 == strpos("$".$host, "https://"))
    {
        curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
        curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
    }
    curl_setopt($curl, CURLOPT_POSTFIELDS, $bodys);
    var_dump(curl_exec($curl));
?>

正确返回示例代码如下:

{
    "msg": "成功",
    "success": true,
    "code": 200,
    "data": {
        "orderNo": "202407102026336827870",
        "info": [
            {
                "line_no": 0, //文本行编号,按从左至右、从上至下顺序依次排列
                "confidence": 0.96655273, //行文本识别置信度 0-1 
                "line_content": "姓名", //识别出的文本行内容
                "line_position": {
                    "x": 53,
                    "width": 53,
                    "y": 66,
                    "line_direction": 0,
                    "height": 22
                }
            },
            {
                "line_no": 1,
                "confidence": 0.98909503,
                "line_content": "陈海江",
                "line_position": {
                    "x": 102,
                    "width": 63,
                    "y": 63,
                    "line_direction": 0,
                    "height": 23
                }
            }
        ]
    }
}


line_no		文本行编号,按从左至右、从上至下顺序依次排列
line_content	识别出的文本行内容
confidence	行文本识别置信度
line_position	文本行位置信息,表示为坐标和旋转角度(左上角X,左上角Y,宽Width,高Height,旋转角度Line Position)+x左上角顶点横坐标X +y	左上角顶点纵坐标Y
width	        矩形框的宽
height		矩形框的高
line_direction	文本行的旋转角度
words		文本行内单字符的内容数组,数组元素为一个Json结构,包含character和confidence
character	候选字符character
confidence	单字符的识别置信度

  • 7
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值