【百度AI】百度OCR之行驶证识别V1

最新推荐文章于 2023-07-13 15:10:48 发布

沧海一笑-dj

最新推荐文章于 2023-07-13 15:10:48 发布

阅读量625

点赞数 1

分类专栏：人工智能文章标签：人工智能 ocr 行驶证识别 AI 百度AI

本文链接：https://blog.csdn.net/dengjin20104042056/article/details/131701867

版权

人工智能专栏收录该内容

20 篇文章 1 订阅

订阅专栏

00. 目录

文章目录

01. 行驶证识别概述

对机动车行驶证主页及副页所有22个字段进行结构化识别，包括号牌号码、车辆类型、所有人、品牌型号、车辆识别代码、发动机号码、核定载人数、检验记录、发证单位等。

在这里插入图片描述

视频教程请参见行驶证识别API调用教程（视频版）

02. 行驶证识别功能演示

网址：https://ai.baidu.com/tech/ocr_cars/vehicle_license

03. 行驶证识别应用场景

司机身份认证

综合应用行驶证、驾驶证和身份证识别技术，自动识别录入用户身份信息和车辆信息，可应用于网约车用户注册、货车司机身份审查等场景，有效提升信息录入效率，优化用户体验。

车主信息服务

基于驾驶证和行驶证识别能力，结构化识别录入用户身份信息和车辆信息，可应用于个性化信息推送、违章信息查询等场景，有效降低用户输入成本，为用户提供信息推送和查询服务。

汽车后市场服务

使用汽车场景下多种卡证和票据识别服务，结构化识别录入用户身份信息和车辆信息，可应用于新能源汽车国家补贴申报、汽车金融保险、维修保养等后市场服务场景，有效提升信息录入效率，优化用户体验。

04. 行驶证识别特点

全字段识别

精准识别行驶证主页及副页所有22个字段，不同业务场景下快速提取任意字段信息，满足各类应用需求。

车辆证照混贴识别

支持识别行驶证正副页、驾驶证正副页在同一张图片上的混贴场景，自动分类并检测识别所有字段。

05. 在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

06. 请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/ocr/v1/vehicle_license

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token，参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	可选值范围	说明
image	和url二选一	string	-	图像数据，base64编码后进行urlencode，要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/jpeg/png/bmp格式
url	和image二选一	string	-	图片完整URL，URL长度不超过1024字节，URL对应的图片base64编码后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/jpeg/png/bmp格式，当image字段存在时url字段失效请注意关闭URL防盗链
detect_direction	否	string	true/false	- false：默认值不进行图像方向自动矫正 - true: 开启图像方向自动矫正功能，可对旋转 90/180/270 度的图片进行自动矫正并识别
vehicle_license_side	否	string	front/back	- front：默认值，识别行驶证主页 - back：识别行驶证副页
unified	否	string	true/false	- false：默认值，不进行归一化处理 - true：对输出字段进行归一化处理，将新/老版行驶证的“注册登记日期/注册日期”统一为”注册日期“进行输出
quality_warn	否	string	true/false	是否开启质量检测功能，仅在行驶证正页识别时生效， - false：默认值，不输出质量告警信息 - true：输出行驶证遮挡、不完整质量告警信息
risk_warn	否	string	true/false	是否开启风险检测功能， - false：默认值，不输出风险告警信息 - true：开启，输出行驶证复印、翻拍、PS等告警信息

请求代码示例

提示一：使用示例代码前，请记得替换其中的示例Token、图片地址或Base64信息。

提示二：部分语言依赖的类或库，请在代码注释中查看下载地址。

命令

curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/vehicle_license?access_token=【调用鉴权接口获取的token】' --data 'image=【图片Base64编码，需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'

C++代码


#include <iostream>
#include <curl/curl.h>

// libcurl库下载链接：https://curl.haxx.se/download.html
// jsoncpp库下载链接：https://github.com/open-source-parsers/jsoncpp/
const static std::string request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/vehicle_license";
static std::string vehicleLicense_result;
/**
* curl发送http请求调用的回调函数，回调函数中对返回的json格式的body进行了解析，解析结果储存在全局的静态变量当中
* @param 参数定义见libcurl文档
* @return 返回值定义见libcurl文档
*/
static size_t callback(void *ptr, size_t size, size_t nmemb, void *stream) {
    // 获取到的body存放在ptr中，先将其转换为string格式
    vehicleLicense_result = std::string((char *) ptr, size * nmemb);
    return size * nmemb;
}
/**
* 行驶证识别
* @return 调用成功返回0，发生错误返回其他错误码
*/
int vehicleLicense(std::string &json_result, const std::string &access_token) {
    std::string url = request_url + "?access_token=" + access_token;
    CURL *curl = NULL;
    CURLcode result_code;
    int is_success;
    curl = curl_easy_init();
    if (curl) {
        curl_easy_setopt(curl, CURLOPT_URL, url.data());
        curl_easy_setopt(curl, CURLOPT_POST, 1);
        curl_httppost *post = NULL;
        curl_httppost *last = NULL;
        curl_formadd(&post, &last, CURLFORM_COPYNAME, "image", CURLFORM_COPYCONTENTS, "【base64_img】", CURLFORM_END);

        curl_easy_setopt(curl, CURLOPT_HTTPPOST, post);
        curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, callback);
        result_code = curl_easy_perform(curl);
        if (result_code != CURLE_OK) {
            fprintf(stderr, "curl_easy_perform() failed: %s
",
                    curl_easy_strerror(result_code));
            is_success = 1;
            return is_success;
        }
        json_result = vehicleLicense_result;
        curl_easy_cleanup(curl);
        is_success = 0;
    } else {
        fprintf(stderr, "curl_easy_init() failed.");
        is_success = 1;
    }
    return is_success;
}

07. 返回说明

返回示例（行驶证正页）


{
	"words_result": {
		"车辆识别代号": {
			"words": "SSVUDDTT2J2022558"
		},
		"住址": {
			"words": "中牟县三刘寨村"
		},
		"发证日期": {
			"words": "20180313"
		},
        "发证单位": {
			"words": "北京市公安局公安交通管理局"
		},
		"品牌型号": {
			"words": "大众汽车牌SVW6474DFD"
		},
		"车辆类型": {
			"words": "小型普通客车"
		},
		"所有人": {
			"words": "郑昆"
		},
		"使用性质": {
			"words": "非营运"
		},
		"发动机号码": {
			"words": "111533"
		},
		"号牌号码": {
			"words": "豫A99RR9"
		},
		"注册日期": {
			"words": "20180312"
		}
	},
	"log_id": "1290127183406170112",
	"words_result_num": 11
}

返回示例（行驶证副页）


{
    "words_result": {
        "检验记录": {
            "words": "2018年11月渝A()"
        },
        "核定载质量": {
            "words": "1490kg"
        },
        "整备质量": {
            "words": "2600kg"
        },
        "外廓尺寸": {
            "words": "5990X2500X4400mm"
        },
        "核定载人数": {
            "words": "2人"
        },
        "总质量": {
            "words": "4290kg"
        },
        "燃油类型": {
            "words": "柴油"
        },
        "准牵引总质量": {
            "words": ""
        },
        "备注": {
            "words": "2033-10-25"
        },
        "档案编号": {
            "words": ""
        },
        "号牌号码": {
            "words": "渝A2780RL"
        },
        "证芯编号": {
            "words": "50027372380230106"
        }
    },
    "words_result_num": 12,
    "log_id": 1483006324030440139
}

返回参数

字段	必选	类型	说明
log_id	是	uint64	唯一的log id，用于问题定位
direction	否	int32	图像方向，当 detect_direction=true 时返回该字段。 - - 1：未定义， - 0：正向， - 1：逆时针90度， - 2：逆时针180度， - 3：逆时针270度
words_result_num	是	uint32	识别结果数，表示words_result的元素个数
words_result	是	object	识别结果
+ words	否	string	识别结果字符串
warn_infos	否	array[]	当输入参数 vehicle_license_side=front，且 quality_warn=true 时输出， - shield：行驶证证照存在遮挡告警提示 - incomplete：行驶证证照边框不完整告警提示
risk_type	否	string	当输入参数 risk_warn=true 时返回识出的行驶证的类型：normal-正常行驶证；copy-复印件；screen-翻拍
edit_tool	否	string	当输入参数 risk_warn=true 时返回，如果检测行驶证被编辑过，该字段指定编辑软件名称，如：Adobe Photoshop CC 2014 (Macintosh)，如果没有被编辑过则返回值为空

08. C++ SDK

最低支持 C++ 11+

直接使用开发包步骤如下：

1.在官方网站下载C++ SDK压缩包。

2.将下载的aip-cpp-sdk-version.zip解压, 其中文件为包含实现代码的头文件。

3.安装依赖库libcurl（需要支持https） openssl jsoncpp(>1.6.2版本，0.x版本将不被支持)。

4.编译工程时添加 C++11 支持 (gcc/clang 添加编译参数 -std=c++11), 添加第三方库链接参数 lcurl, lcrypto, ljsoncpp。

5.在源码中include ocr.h ，引入压缩包中的头文件以使用aip命名空间下的类和方法。

文字识别 C++ SDK目录结构

├── base
│  ├── base.h                                // 请求客户端基类
│  ├── base64.h                              // base64加密相关类
│  ├── http.h                                // http请求封装类
│  └── utils.h                               // 工具类
└── ocr.h                             // 文字识别 交互类

09. 新建client

client是文字识别的C++客户端，为使用文字识别的开发人员提供了一系列的交互方法。当您引入了相应头文件后就可以新建一个client对象。

用户可以参考如下代码新建一个client：

    #include "ocr.h"

    // 设置APPID/AK/SK
    std::string app_id = "你的 App ID";
    std::string api_key = "你的 Api key";
    std::string secret_key = "你的 Secret Key";

    aip::Ocr client(app_id, api_key, secret_key);

在上面代码中，常量APP_ID在百度智能云控制台中创建，常量API_KEY与SECRET_KEY是在创建完毕应用后，系统分配给用户的，均为字符串，用于标识用户，为访问做签名验证，可在AI服务控制台中的应用列表中查看。

10. 行驶证识别API

对机动车行驶证所有关键字段进行识别

	Json::Value result;

    std::string image;
    aip::get_file_content("/assets/sample.jpg", &image);

    // 调用行驶证识别
    result = client.vehicle_license(image, aip::null);

    // 如果有可选参数
    std::map<std::string, std::string> options;
    options["detect_direction"] = "true";
    options["accuracy"] = "normal";

    // 带参数调用行驶证识别
    result = client.vehicle_license(image, options);

行驶证识别请求参数详情

参数名称	是否必选	类型	可选值范围	默认值	说明
image	是	std::string			图片数据的二进制字符串，可以使用aip::get_file_content函数获取
detect_direction	否	std::string	true false	false	是否检测图像朝向，默认不检测，即：false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true：检测朝向； - false：不检测朝向。
vehicle_license_side	否	string	front/back	front	- front：识别行驶证主页 - back：识别行驶证副页
unified	否	string	true/false	false	- false：不进行归一化处理 - true：对输出字段进行归一化处理，将新/老版行驶证的“注册登记日期/注册日期”统一为”注册日期“进行输出

行驶证识别返回数据参数详情

字段	必选	类型	说明
log_id	是	number	唯一的log id，用于问题定位
words_result_num	是	number	识别结果数，表示words_result的元素个数
words_result	是	array(object)	识别结果数组
+words	否	string	识别结果字符串

行驶证识别返回示例


{
  "errno": 0,
  "msg": "success",
  "data": {
    "words_result_num": 10,
    "words_result": {
      "品牌型号": {
        "words": "保时捷GT37182RUCRE"
      },
      "发证日期": {
        "words": "20160104"
      },
      "使用性质": {
        "words": "非营运"
      },
      "发动机号码": {
        "words": "20832"
      },
      "号牌号码": {
        "words": "苏A001"
      },
      "所有人": {
        "words": "圆圆"
      },
      "住址": {
        "words": "南京市江宁区弘景大道"
      },
      "注册日期": {
        "words": "20160104"
      },
      "车辆识别代号": {
        "words": "HCE58"
      },
      "车辆类型": {
        "words": "小型轿车"
      }
    }
  }
}

11. 行驶证识别V1

test.cpp

#include <iostream>
#include "ocr.h"

using namespace std;



int main(void)
{


    // 设置APPID/AK/SK
    std::string app_id = "360326215";
    std::string api_key = "OMlBgMaGMtadGz30AHRRQk4vWS";
    std::string secret_key = "YnwP0KplEgUq4XdfbqgII9tzmBPv0LGm6o";

    aip::Ocr client(app_id, api_key, secret_key);


    Json::Value result;

    std::string image;
    aip::get_file_content("./1.jpg", &image);

    // 调用行驶证识别
    result = client.vehicle_license(image, aip::null);

#if 0
    // 如果有可选参数
    std::map<std::string, std::string> options;
    options["detect_direction"] = "true";
    options["accuracy"] = "normal";

    // 带参数调用行驶证识别
    result = client.vehicle_license(image, options);
#endif

    cout << result << endl;




    return 0;
}

12. 附录

参考代码：vehicle-license-v1.rar

沧海一笑-dj

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
【百度AI】百度OCR之行驶证识别V1

对机动车行驶证主页及副页所有22个字段进行结构化识别，包括号牌号码、车辆类型、所有人、品牌型号、车辆识别代码、发动机号码、核定载人数、检验记录、发证单位等。视频教程请参见行驶证识别API调用教程（视频版）
复制链接

扫一扫

专栏目录